近期ChatGPT频频上“热搜”,作为生成式人工智能的典型代表,ChatGPT的出现也让生成式人工智能备受关注。在近日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动中,来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一起,面向行内研究者分享了包括生成式人工智能、图像文档处理中的结构建模、底层视觉技术等研究及实践成果。
“企业行”活动中,上海交通大学人工智能研究院常务副院长、长江学者杨小康分享了团队在生成式人工智能领域的工作,他表示,目前的生成式人工智能还存在解空间巨大、宏观一致性差、微观清晰度受限等问题,需要通过数学、物理、信息论、脑认知、计算机等学科交叉研究,进一步夯实生成式人工智能的基础理论,通过“物理+数据”联合驱动, “虚拟+现实”深度融合,助力科学发现的加速。
他认为,以“识别——分析”为代表的判别式人工智能推动了人工智能前十年的发展,接下来十年,以“合成——重建”为代表的生成式人工智能将成为主流。
复旦大学计算机学院教授、上海市计算机学会自然语言处理专委会主任邱锡鹏提到,强大的情景学习能力、思维链能力和自然指令学习能力是以ChatGPT为代表的对话式大型语言模型的主要特点,将加速通用人工智能的实现。“文本所承载的知识只是冰山一角,还有很多‘暗知识’并不是以文本形式记录的。在未来的发展里,人工智能还有‘具身学习、跨模态学习’等更多知识领域需要学习。”邱锡鹏说。
人工智能要实现多场景“通用”,需要解决多源数据的问题。比如社交媒体等信息渠道包含了海量非合作、异构化、跨模态的数据,既蕴藏了大量的人类知识与高价值信息,也包含了各种自然与人为的噪声,对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。厦门大学科技处处长、人工智能研究院负责人纪荣嵘教授表示,连接视觉与自然语言的“视觉描述”领域,是最受关注且最具潜力的人工智能研究任务之一 。
合合信息基于人工智能和大数据技术,以底层视觉作为重要研究方向之一,主要研究如何提高或恢复各类场景下的图像、视频内容,如清晰度提升,低质量及破损图像恢复等,相关理论和方法在手机图像采集与处理,医疗图像分析等领域发挥着至关重要的作用。合合信息图像算法研发总监郭丰俊博士针对目前底层视觉技术在处理形变、模糊、阴影遮盖、背景杂乱的文档时遇到的典型问题,就公司技术团队在智能图像处理技术模块、融合技术典型应用、图像安全领域等领域的研究成果进行了分享。
郭丰俊提到,合合信息智能文档处理技术基于对图像目标区域的精准裁剪,对弯曲、倾斜透视的页面进行形变矫正,在去除阴影、摩尔纹后,通过人工智能技术对文档图像进行增强锐化和清晰度提升,达到“图像质量增强”的效果,在改善阅读体验的同时,也提升了识别转换、图像分析等文档处理下游任务的质效,相关技术已通过“扫描全能王”等智能文字识别产品,服务全球上百个国家和地区的上亿用户。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com