6日,记者从北京大学北京国际数学研究中心了解到,该中心董彬教授课题组与合作者组建的AI4Math团队用自主构建的自动化AI框架解决了交换代数中一个开放问题——安德森猜想,并在用于形式化验证数学定理正确性的编程语言和定理证明器——Lean中完成了约19000行的形式化验证。这是国内首次以AI框架攻克交换代数开放问题并实现大规模形式化验证,开辟了数学与AI深度融合的更多可能。
安德森猜想由美国数学家安德森于2014年提出,它关注的是“准完备局部环”的一类性质——这类环旨在用代数工具刻画几何对象局部(如某点附近)的无穷小结构与变形。该猜想提出后十余年始终无人突破。
此次解决安德森猜想,北京大学AI4Math团队搭建的双智能体协作框架功不可没。该框架由自然语言推理智能体Rethlas和形式化验证智能体Archon组成。
研究中,Rethlas通过团队自研的Matlas自然语言语义检索系统,从上千万条数学陈述中精准定位到与猜想看似无关的整环完备化理论成果,以此构造反例。随后,Archon将证明转化为约19000行Lean代码,并在过程中自主发现初始方案存在隐含的逻辑漏洞,重新设计了形式化证明的整体技术路线,还在所需数学概念于Lean形式化数学库中尚未收录时,自主找到等价替代路径,最终完成的代码覆盖6篇外部论文关键结果,完成同等规模形式化工作的效率较经验丰富的Lean专家提升至少10倍。
该成果的背后是团队三年的技术积累与跨学科协作。2023年,北京大学AI4Math团队正式组建,它由一群对这个方向有共同判断的人逐步自然汇聚而成,团队成员来自代数与数论、优化、机器学习与人工智能等方向。
董彬告诉科技日报记者,团队认为,让AI做严肃数学推理,检索最为关键。他们打造了双引擎检索架构——LeanSearch和Matlas。LeanSearch用自然语言描述需求即可语义检索出相关定理,现已被Lean官方社区广泛使用。Matlas则覆盖上千万条数学陈述,支持命题级语义检索。在这些基础设施之上,他们搭建了前述两个AI智能体。
北京大学数学科学学院院长、中国科学院院士刘若川指出,此次探索不仅解决了具体数学问题,更验证了AI与数学融合的新研究范式。中国科学院院士田刚由此呼吁,应鼓励和支持青年学者大胆创新,进一步推动AI与数学的深度融合,并在国家急需解决的重大科技问题中发挥关键作用。(记者张盖伦)
责任编辑:kj005
智能宠物硬件行业正站在一个关键的十字路口追根溯源,问题不在于硬件本身,而在于硬件缺少一个真正“懂宠物”的认知引擎一、智能跃迁:宠智灵大模...
2026年,全球商业航天已从早期的技术验证阶段,加速迈入规模化运营的关键过渡期天硕(TOPSSD)X55系列航天级固态硬盘采用国产化方案,通过自研主控、抗辐照复...
2026年初,工业和信息化部等八部门联合印发的《中药工业高质量发展实施方案(2026—2030年)》,为正处于转型升级关键期的中国中药工业指明了航向...
一、引子:当流量规则被AI改写如果你最近在关注企业营销,一定听过这两个词:短视频矩阵和GEO但冷静下来思考:这究竟是昙花一现的短期热潮,还是代表未来的长期趋势?...
很多人点霸王茶姬外卖时,都会纠结一个核心问题:霸王茶姬的伯牙绝弦茉莉雪芽外卖好吃吗?作为霸王茶姬的当家爆款,这款以茉莉雪芽为茶底的茶饮累计卖出12.5亿杯,贡献...
一、GEO赛道的地域版图与模式分野在AI营销的浪潮中,GEO(生成式引擎优化)已成为企业争夺下一代流量的关键战场讯灵GEO扎根深圳,这座以“速度&r...
樱花的盛开,从来都是一场关于时间的对话此次樱花清酒系列以粉色与银色为视觉核心,呈现更为清透、现代的春日美学樱花本无味樱花开了,家也香了樱花清酒晶石香盒 粉澳宝、...
说实话,现在咱们熬夜、喝酒、吃外卖,这些看似平常的小事,其实都在悄悄掏空肝的"老本"测评看重啥?四个硬指标不整虚的,我们主要看这几点:成分够不够猛、身体能不能吸...
4月15至17日,2026国际气体工业博览会将在江苏无锡太湖国际博览中心耀世启幕展品范围全面覆盖气体分离、纯化、压缩、储运、分析、回收等核心技术及配套设备,同时...
2026连云港第3届安团家博会将于4月10日-12日在连云港工业展览中心举办安团家博会深耕家装团购领域21年,专注一站式家装采购服务作为苏北地区春季重磅家居行业...
核心结论本次评测综合临床验证、认证合规、成分与技术、用户反馈、性价比五大核心维度,对市面热门护肝片进行量化实测,所有评测数据均来自品牌官方临床报告、权威机构认证...