科技
设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置: 科技 > 业界 >

智源自然语言处理重大研究方向前沿技术开放日举办

智源自然语言处理重大研究方向前沿技术开放日举办
2022-01-08 17:32:01 来源:科技日报

科技日报记者 华凌

日前,北京智源人工智能研究院(以下简称“智源研究院”)自然语言处理(简称NLP)重大研究方向前沿技术开放日活动成功举办。24位NLP学术明星,20多项前沿报告、10余项最新研究成果“组团”亮相。活动中重磅发布大模型评测的“命题”新方案——智源指数,同时展开OpenHowNet前沿技术研讨。新老学者群星汇聚,研究探讨多点开花,现场学术气氛浓厚。

智源指数CUGE发布仪式

清华大学教授、智源研究院自然语言处理(NLP)方向首席科学家孙茂松

北京语言大学教授、国家语言文字工作委员会原副主任李宇明教授在致辞中指出:“我特别赞赏智源(NLP重大研究方向)的开放态度,汇集众智,推进中文信息处理工作前进,促进中文在人类社会中发挥更大的作用。”

智源研究院常务副院长曹岗则表示:“一起协作、共同贡献,人工智能领域各单位与学者们的开放心态与探索精神,是科研发展了不起的源动力。未来,希望和大家携手,共创更高价值。”

发布智源指数CUGE 推出大模型评测“命题”新方案

人工智能大模型时代,评测基准成为大模型发展的风向标。从扁平到全面系统,从简化到多重维度,智源指数CUGE旨在尝试为大模型评测设计一张全面评估综合能力的新考卷。

清华大学教授、中国人工智能学会理事长戴琼海院士对智源指数在创新方向上的尝试给予肯定,并表示:“祝贺孙茂松教授带领智源NLP学者共同建立机器中文语言能力评测基准‘智源指数’,这对中文信息处理乃至我国人工智能的发展,都具有重要的里程碑意义。”

中国工程院院士、清华大学教授、中国人工智能学会理事长戴琼海院士

在基准框架上,不同于传统将常用数据集扁平组织的方式,智源指数根据人类语言考试大纲和当前NLP研究现状,以语言能力-任务-数据集的分层框架来选择和组织数据集,涵盖7种重要的语言能力、17个主流NLP任务和19个代表性数据集,全面均衡,避免“偏科选拔”。

在评分策略上,智源指数能更好展现模型不同维度的模型语言智能差异,依托层次性基准框架,提供不同层次的模型性能评分,包括在数据集、任务和语言能力等,系统性大大加强。

全面系统、多维度的智源指数

为了促进智源指数的共建共享,提升智源指数的易用性,本次活动还同时发布了在线评测平台和公开排行榜,支持多种展示模式,包含综合榜、精简榜和单数据集榜,方便用户快速多角度了解模型和数据集特性及最新动态。

“发布仅是起点,发展还需生态共建。”刘知远副教授说,“基于单数据集的榜单能力,未来智源指数将定期吸纳最新优秀数据集。同时,我们还将依托智源研究院、智源社区的力量,建立用户面向数据集和评测结果的反馈、讨论机制,构建起中文高质量数据集社区,推动中文自然语言处理发展。”

10余项丰硕成果 智源NLP研究方向探索与落地并重

除“智源指数”外,本次活动中还进行“自然语言处理评测中的问题与对策”“迈向通用连续型知识库”“文本复述生成”等研究成果的阶段性汇报,内容涵盖预训练模型、知识计算、人机对话、文本生成等10余项重点NLP科研问题。

自然语言处理(NLP)是智源重大学术研究方向之一,由清华大学孙茂松教授任该方向首席科学家,北京语言大学杨尔弘教授任项目经理。

自然语言处理方向智源学者

在智源研究院的支持下,自然语言处理重大研究方向学者团队积极探索自然语言处理新格局,通过大数据与富知识双轮驱动,并通过与跨模态信息进行交互,显著提升以自然语言为核心的中文语义理解与生成能力。

智源学者探索的自然语言处理新范式

落地应用方面,清华大学李涓子教授团队构建的“多模态北京旅游知识图谱”可以为路径规划和景点信息查询等功能提供数据支持,为游客进行旅游行程的规划。

京东集团副总裁、智源研究员何晓冬博士团队针对大规模与训练语言模型在长文本理解任务上的不足,通过从局部视角到全局视角的重复阅读方法(Read-over-Read),提出了一种基于多视角的机器阅读理解模型,显著地提高针对长文本的阅读理解能力。

多样性文本复述方面,北京大学王选计算机研究所研究员、智源研究员万小军团队的科研成果实现了两个“业界首个”:成功构建了业界首个面向学术文献领域的文本复述数据集ParaSCI,提出了多样化语句复述模型DivGAN,并提出业界首个篇章复述模型-CoRPG。该系列研究分别为文本复述领域提供基础数据资源、方法模型以及新的思路,从而推动文本复述技术的应用落地。

预训练大模型方面,为突破预训练语言模型(Pretrained Language Model, PLM)的高计算成本、高设备需求、难应用适配等瓶颈问题,清华大学副教授、智源青年科学家刘知远等提出面向PLM的全流程高效计算框架,并基于此框架构建以中文为核心的超大规模预训练语言模型CPM-2,具有1980亿参数,覆盖多语言、兼顾语言理解和语言生成的功能,并研制了BMInf、OpenPrompt等配套开源工具。

(文中图片均由智源研究院提供)

责任编辑:kj005

文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com
关键词:

电子眼、机械臂、5G应用等 甘肃传统工业转型升级步入快车道

2022-01-06 09:33:47电子眼、机械臂、5G应用等 甘肃传统工业转型升级步入快车道

机器人产业迎来跨越发展窗口期 产业呈现良好发展势头

2022-01-04 09:30:23机器人产业迎来跨越发展窗口期 产业呈现良好发展势头

成功率100%!中国长征火箭发射创下新纪录

2021-12-31 10:02:31成功率100%!中国长征火箭发射创下新纪录

长征火箭2021年宇航发射圆满收官 累计完成48次发射

2021-12-30 09:17:48长征火箭2021年宇航发射圆满收官 累计完成48次发射

完成第二次出舱任务!中国航天员首次在太空跨年

2021-12-28 09:57:26完成第二次出舱任务!中国航天员首次在太空跨年

我国多型运载火箭正在研制阶段 未来几年内将完成首飞

2021-12-28 09:40:18我国多型运载火箭正在研制阶段 未来几年内将完成首飞

相关新闻

最新资讯