今日,第四范式正式推出全新一代文档数字化管理平台——Smart Archive 2.0。该产品基于第四范式自研的文档处理大模型,实现零样本下对企业文档的精准识别及信息提取。文档处理大模型利用二十多个行业,上百种场景下的企业文档、表格、合同、票据、卡证、印章等海量数据训练而成,并融合了深度学习、迁移学习、多模态学习等先进技术,实现了对各类通用版式、自定义版式及复杂长文本的信息识别及提取,大幅提升企业的文档处理效率。
购房合同识别(长文本、不定版式)
智能识别房本(套打错位、多版式)
运管纸质对账单识别
Smart Archive 2.0 的其他特性:
能力全面:版式分析、文字识别、表格识别、印章识别、标准证照、自定义版式信息提取等全面功能
零样本学习:依托于第四范式自研的大模型技术,Smart Archive 2.0无需样本训练即可直接识别各类文档,显著降低了数据标注和训练建模工作量
长文本理解:在处理复杂长文档如合同、财报、审计底稿时,提供出色的信息提取能力
RAG场景优化:针对RAG文档处理场景进行了重点优化,实现文档高质量切分与预处理解析
顶尖的表格识别能力:能够针对有线表、无线表、少线表和跨页表格准确解析还原
在数据安全方面,第四范式 Smart Archive 提供了多种数据安全机制,并支持本地化部署,确保了数据处理的安全性和私密性。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com2024年10月3日-4日、10月6日-7日,COMICUP 30(以下简称CP30)在杭州大会展中心如期举行。由蛮啾网络与...
(硅谷时报讯)2024年10月5日,美国硅谷圣克拉拉会议中心迎来了华源科技协会(HYSTA)2024年会暨25周年庆...
2024年10月3日-4日、10月6日-7日,COMICUP 30(以下简称CP30)在杭州大会展中心如期举行。由蛮啾网络与...
(硅谷时报讯)2024年10月5日,美国硅谷圣克拉拉会议中心迎来了华源科技协会(HYSTA)2024年会暨25周年庆...