DeepSeek改变了硅谷对AI的认知
作者 Kevin Roose
发表于 2025年3月

一项人工智能突破给股市带来了冲击波,让硅谷巨头们感到不安,并引发了关于美国技术主导地位终结的大讨论。但与这项突破相关的论文标题却简单朴素,颇为学术—《通过强化学习激励大型语言模型的推理能力》。

这篇长达22页的论文是一家名为DeepSeek的中国人工智能初创公司在1月22日发布的,最初并未引发太大关注。AI从业人员大多花了几天时间来消化论文的主张及其所描述的含义。该公司创建了一个名为DeepSeek-R1的AI模型,并声称他们仅使用了数量不多的二流AI芯片,以极低的成本便能匹敌领先的美国AI模型的性能。

DeepSeek表示,它是通过巧妙的工程设计弥补了计算能力的不足。一些行业观察人士最初对DeepSeek取得的突破表示难以置信。他们认为,DeepSeek肯定是通过某种作弊手段才取得R1的成果,或者捏造了数据,让模型看起来比实际情况更有吸引力。也许R1其实只是对美国AI模型的巧妙改版,并未代表什么真正的进展。

最后,随着越来越多的人深入研究DeepSeek-R1的细节—与市面上大多数领先的AI模型不同,它是以开源形式发布的,外界可以更仔细地探究它的内部运作—上述的怀疑逐渐转变成了担忧。

1月下旬,当大量美国人开始亲自使用DeepSeek的模型,DeepSeek移动应用也登顶苹果AppStore排行榜,恐慌情绪彻底爆发。

我认为,该公司的小额经营成本可能被严重夸大了,但我确实认为,DeepSeek-R1的突破是真实的。

本文刊登于《第一财经杂志》2025年3期
龙源期刊网正版版权
更多文章来自
订阅