DeepSeek发布了全世界第二个推理大模型,仅比OpenAI慢四个月,双方大模型的性能相当,但性价比却差出二三十倍,这是因为DeepSeek做了杰出的工程创新。但工程创新属于渐进式创新,不是从0到1的颠覆式创新,有读者对此表示失望,说至少也是从0.5到1吧?
其实不用失望,因为从0到1和从1到100同等重要,完全没必要厚此薄彼。举个例子,托马斯·萨弗里(Thomas Savery)在詹姆斯·瓦特(James Watt)出生前38年就发明了蒸汽机,但是不好用,一直未能推广。瓦特对蒸汽机做了重大改进,使蒸汽机得以普及,由此引发了工业革命。你说是萨弗里发明蒸汽机重要呢,还是瓦特改进蒸汽机重要呢?
这篇文章我们接着讨论创新规律。一句话总结:好奇心+自由探索,这七个字就是DeepSeek的创新精髓。如果再加三个字,那就是:不差钱。
我先讲讲DeepSeek的创新力从何而来,再给大家介绍六种代表性的创新思想。
DeepSeek的创新力从何而来
DeepSeek非常低调,对外界而言它是个谜一般的存在,我们能看到的关于它的信息,基本上都来自行业媒体《暗涌》对梁文峰的两次专访。
梁文峰1985年出生,2010年从浙江大学信息与通信工程专业硕士毕业。2016年,他成立了一家用人工智能炒股票的基金公司——幻方量化,赚了大钱。2022年11月,OpenAI发布ChatGPT,引发全球性的大模型浪潮。2023年4月,梁文峰宣布专门成立一家叫DeepSeek的公司做大模型,5月,他首次接受《暗涌》专访。2024年5月,DeepSeek发布V2,震动业界,7月,他第二次接受《暗涌》专访。
在这两次专访中,梁文峰讲述了创新的原动力何来,创新型人才有什么特质,以及该怎么管理创新型组织。
他说:创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。过去30多年IT浪潮里,我们基本没有参与到真正的技术创新里。大部分中国公司习惯follow(追随),而不是创新。中国AI和美国真正的gap(差距)是原创和模仿。如果这个不改变,中国永远只能是追随者。
DeepSeek的使命就是“做研究、做探索”,推动技术前沿的发展,从根本上促进整个生态的成长。
创新不仅是商业驱动,它还需要好奇心和创造的野心。我们做创新,主要是好奇心驱动,对AI能力边界的好奇。
梁文峰近日告诉新希望集团董事长刘永好,DeepSeek只有160个人。他们都是些什么样的人呢?
梁文峰说:DeepSeek的招聘标准一直基于热情和好奇心。我们的团队成员背景各异,充满个性和趣味性,他们对研究的渴望远超对金钱的关注。
DeepSeek没有什么“难以捉摸的天才”,只是来自顶尖高校的应届生、博士生(甚至是四五年级的实习生),以及一些有几年经验的年轻人。
这160号充满好奇心和创造欲的年轻人聚集在一起之后,又是怎么工作的呢?
梁文峰说:创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。
DeepSeek完全是自下而上的。我们不预先设定角色,而是自然形成分工。每个人都带着自己的经验和想法,不需要被推动。当他们遇到挑战时,会自发地拉上别人讨论。不过,一旦某个想法被证明有潜力,我们就会从上层投入资源,推动它的发展。
DeepSeek的计算资源,团队成员使用时没有限制。如果有人有想法,他们可以随时调用我们的训练集群,无需审批。此外,由于我们没有严格的层级架构或部门壁垒,只要彼此感兴趣,团队成员可以自由协作。
可以看到,DeepSeek是一家高度扁平化的、自组织的、靠员工内驱力往前走的公司。但如此自由宽松和开放式的管理,不会导致公司散架吗?
梁文峰说:我们在招人时确保价值观一致,然后通过企业文化来确保步调一致。我们并没有一个成文的企业文化,因为所有成文东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。
在第二次专访的最后,《暗涌》的记者问了一个非常好的问题:“好奇心驱动的疯狂可以一直持续下去吗?”
梁文锋回答说:“不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的,投入地去做一件事。

