突围战,中国AI又迭代了
作者 荣智慧
发表于 2025年6月
AI创意图(制作/郭嘉亮)

近期,DeepSeek-R1模型完成一次版本迭代。这次“小更新”引发了大量关注,测评显示,其整体性能逼近目前顶级模型OpenAIo3和谷歌Gemini2.5-Pro。

同一时间,华为推出参数规模7180亿的盘古UltraMoE大模型,全流程在昇腾AI计算平台训练。

可以说,中国人工智能大模型的新赛季从此开启,一边是深度求索的开源低成本模式,一边是华为全栈自研的“可控闭源”模式。

当OpenAI和谷歌强化“更大参数”和“更强通用性”时,中国AI大模型逐渐进入“拼软件”或者“拼硬件”的“极致性价比”时代。按照历史经验,无论技术由谁开创,只要进入“性价比”竞争阶段,中国企业的优势总是一骑绝尘。

话又说回来,到底是“软件定义AI”还是“硬件定义AI”,可能正决定着大模型的未来形态。

R2还没来,R1先迭代

千呼万唤的R2模型没出现,只有R1的迭代版本给大家“望梅止渴”。

5月29日,深度求索宣布其R1模型成功完成版本迭代,新版本为DeepSeek-R1-0528。这个版本依然基于2024年12月推出的DeepSeekV3Base模型,在后期训练阶段增加了算力投入,增强了模型的思维深度和推理能力。

此次升级后,模型的响应质量提升,在复杂推理、多步骤计算方面更准确,长文理解和生成更连贯,数学和编程等专业性输出更可靠;响应速度也有相应提升,在网页端、App和API接口中反应更快,处理超长文本输入时,延迟有所降低;对话的稳定性增强,减少了“遗忘设定”或“离题”的情况;API和接口兼容性保持稳定,升级后,用户无需调整现有集成就可以无缝使用新版本。

最明显的变化是“思维链”—像谷歌的Gemini一样进行深度推理,写作的效果更加自然。

华为Atlas 900 AI 集群

在性能方面,首先是模型的智能水平提升,在AIME2024(数学竞赛,+21分)、LiveCodeBench(代码生成,+15分)、GPQADiamond(科学推理,+10分)和《人类最后考卷》(推理与知识,+6分)等多个方面实现进步;其次是编程能力提升,在ArtificialAnalysis编程能力指数中,R1已追平Gemini2.5Pro,仅次于o4-mini(高水准版)和o3模型。

本文刊登于《看世界》2025年13期
龙源期刊网正版版权
更多文章来自
订阅