近几年,全球数字经济进入高速发展的阶段,人工智能技术的应用场景也在不断拓展,出现了较多技术参差不齐、安全风险不明的AI产品。对此,中国信息通信研究院(以下简称“中国信通院”)构建了“可信AI”评测体系,并落实到人工智能的技术、产品和应用中。
近期,合合信息智能文字识别产品通过“可信AI”——智能文档处理系统评估工作,并获得“5级”评定。据悉,“5级”为该模块最高评定等级。评估结果显示,合合信息智能文档处理产品在通用能力及AI核心能力方面均表现优异。
智能文档处理(IDP)技术能够从多格式文档的半结构化/非结构化数据中高效捕捉、提取和处理关键信息,大幅节省文件处理时间。这项技术是“可信AI”近两年新增的评测项目之一,使用场景和潜在应用场景都非常广泛。
首先在通用能力方面,合合信息表格文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,在信息抽取、表格文字识别、版面分析等文档处理的难点上均获得5分评分。
基于分治思想,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中识别单元格结构准确率高于98%;无线表识别采用自研序列模型、规则匹配等方案预测表格逻辑顺序从而构建物理框架,保证了区域内容的完整性,检测准确率也显著提升。
合合信息最新研发的版面分析与文档还原技术将文档图像按照文本、图形、公式、表格等不同类型内容切分区域,并分析之间的逻辑关系,精准判定文档中的文字位置、字体、大小和排版方式,从而在各类版式复杂的图片文档中准确获取关键信息。
其次,合合信息智能文字识别产品在NLP领域的文本分类、知识图谱领域的实体识别、关系抽取及OCR领域的字符识别、文本行识别等AI核心能力方面均获得5分评分,并在文本生成、事件抽取等高阶处理能力中表现突出,准确率、召回率、F1值等指标得到较高评分。
此外,合合信息也在积极构建人工智能技术的安全屏障,与中国信通院、中国图象图形学学会、中国科学技术大学等知名学术机构联合编制《文档图像篡改检测标准》,助力人工智能技术的发展和产业的健康成长。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com近日,腾讯音乐娱乐集团(以下简称TME)与Electric Daisy Carnival(以下简称EDC)达成全面战略合作,同时...