通义灵码上新推理模型 Qwen2.5-Max，编程能力第一

2025-03-05 11:30:50 来源：看点时报

小大

近期，通义灵码上新了模型选择功能，除支持 DeepSeek 满血版 V3 和 R1 外， Qwen2.5-Max 也正式上线。据了解，在三方基准测试平台Chatbot Arena公布的最新大模型盲测榜单中，Qwen2.5-Max 超越 DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型；同时，Qwen2.5-Max在数学和编程等单项能力上排名第一。用户可以在通义灵码智能问答、AI 程序员窗口的输入框中，单击模型选择的下拉菜单即可体验 Qwen2.5-Max。

通义灵码是基于通义大模型的 AI 研发辅助工具，提供代码智能生成、研发智能问答、多文件代码修改、任务自主执行等能力，这次内置最新的 Qwen2.5-Max 模型，编程能力、速度、准确率全面提升。据了解，在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

此外，在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现领先。同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比，如下图所示，通义千问的基座模型在大多数基准测试中都展现出了显著的优势。

通义灵码作为国内首个真正落地的 AI 程序员，在上线后展现出诸多优势。它支持 VS Code、JetBrains IDEs 等主流开发工具，实现前后端开发全覆盖，能够通过全程对话协作帮助开发者从 0 到 1 完成复杂编码任务，比如需求实现、问题修复以及批量生成单元测试等多文件级编码任务，这得益于 Qwen2.5 - Max 和 DeepSeek 满血版等开放强大的底层模型加持，从而为开发者提供了更高效、便捷的编程辅助体验，有力地推动了编程领域的发展与创新。

目前，通义灵码已经内置 DeepSeek 满血版以及 Qwen2.5-Max，欢迎大家下载通义灵码插件，体验全面、强大的编程能力！

关键词：

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

通义灵码上新推理模型 Qwen2.5-Max，编程能力第一

相关新闻

最新资讯

科技推荐

科技图片

光路科技最新矿用本安型以太网交换机亮相太原煤机装备展

这篇文章帮你理解新高考政策和学校选择，帮你孩子在成都高一选择一所好学校！

皇家围场1619 | 走进深圳践行中医药社会责任 守护全民睡眠健康

国家战略赋能产业腾飞 制度创新领航全球布局 ——解码宿迁专班护航金天国际全球大会背后的中国创新密码

宁波送子鸟医院：医联上海瑞金，为甬城不孕家庭圆梦

中信科智联数字化高速、低空+……这些实践成果太精彩！

新闻排行

皇家围场1619 | 走进深圳践行中医药社会责任守护全民睡眠健康

国家战略赋能产业腾飞制度创新领航全球布局 ——解码宿迁专班护航金天国际全球大会背后的中国创新密码