“AI实用手册”从1月与各位见面,到这期就满一年了。每期文章,我都希望通过介绍一个近期有创新的产品形态,和喜欢尝鲜的用户一起探讨AI在日常的生活和工作中的新场景、新可能性。从“实用”角度回顾这一年AI产品的进步:一方面,得益于模型能力的提升,一些产品形态从“没法用”变成了“可以试试”;另一方面,产品形态的演进也让模型能力可以更好地在具体场景落地。
先说模型能力。2025年的主角毫无疑问是推理模型。2024年12月OpenAI的o1正式上线,当时还需要每个月交200美元才能使用“完全体”;一个多月后,免费的DeepSeek-R1就让大众第一次体验到了推理模型的有趣之处,看到AI“思考”的过程。到现在,推理模型已经成为标配。无论是AI聊天、编程还是搜索,只要有文本AI的地方,大部分产品默认提供的都是推理模型,我们也习惯了看到AI在喃喃自语地“思考”。这一切都发生在过去一年里。
推理模型的出现对AI编程帮助很大。2024年12月正式发布的Devin让人们第一次见识到了全自动完成任务的“远程实习生”。AI编程的准确度越来越高,“vibe coding”这个有点自嘲的词在2025年2月被创造出来,用于形容那种完全信任AI、“无脑”接受AI建议的编程方式,风靡一时。
有些媒体称2025年为“AI编程元年”,也有些称2025年为“agent元年”。推理模型的准确度提升可以让AI从完成单次问答进步到自主规划和执行分步骤的复杂任务;而编程能力泛化后,AI也可以通过编写程序的方式来完成用户的任务。这些进步放在一起,才让像Manus这样不仅能查资料,也能替用户直接操作的通用agent成为可能。如今,许多AI聊天框都具备了一定的任务执行能力。
AI编程也催生了一些新形态的产品。例如,由于AI生成简单软件的成本低廉,软件的“即用即抛”成为可能。即使用户并非程序员,AI也可以主动为用户当下的需求即时生成一个定制化的软件。比如,现在有些AI聊天机器人在回答完复杂问题后会生成一个漂亮的互动网页来展示答案,这就是通过调用AI编程实现的。




