
中国新创公司深度求索(DeepSeek)开发的AI助理今天成为App Store上评分最高的免费应用程序。DeepSeek训练成本低廉,表现不亚于美国最优秀的大语言模型,对于美国芯片管制是否有效限制中国AI发展,科技业界议论纷纷。
路透社等媒体报导,自DeepSeek-V3推出以来,这款人工智能(AI)应用程序在美国用户中人气激增。开发者表示,它的性能在全球不仅超越其他开源模型,还可与最先进的闭源模型相媲美。随后,DeepSeek于本月20日推出了专为解决复杂问题而设计的R1模型。
法新社报导,DeepSeek可以在手机或是台式机上使用,且具备许多西方竞品的功能,例如撰写歌词、协助制订个人发展计划,甚至能根据冰箱里的食材生成晚餐食谱。
与百度的「文心一言」(Ernie Bot)等许多中国聊天机器人一样,DeepSeek存在某些限制,当被问及中国国家主席习近平或北京当局的新疆政策时,它请求法新社「谈些别的话题」。
然而,从编写复杂的程序到解决困难的计算,DeepSeek的能力不逊于竞争对手,令业内人士感到惊讶。
美国AI新创公司Scale AI首席执行官亚历山大.王(Alexandr Wang)告诉财经媒体CNBC:「我们发现…DeepSeek表现得最出色,可能与美国最优秀的模型表现不相上下。」
分析师长期以来认为,美国在生产高功率芯片方面的关键优势,以及限制中国取得相关技术的能力,将确保美国在AI竞赛中占据优势地位。
然而,DeepSeek表示,训练其中最新一款模型的成本为560万美元,相比之下,AI开发商Anthropic首席执行官阿莫戴(Dario Amodei)去年曾表示,打造一个AI模型需要花费1亿至10亿美元。
DeepSeek在一份技术报告中表示,他们仅用2000多颗辉达公司(NVIDIA)芯片来训练其V3模型。相比之下,训练类似规模的模型通常需要数万颗芯片。
美国政府试图阻止最先进辉达产品进入中国,尽管DeepSeek上述花费遭到质疑,但据悉其使用的芯片性能不及最先进辉达产品,加上相对低廉的训练成本,已引发美国科技业高层对科技出口管制有效性的质疑。
美国总统川普的亲密顾问、创投家安德立森(Marc Andreessen)形容这是「AI的史普尼克时刻」。史普尼克时刻意指苏联抢先美国发射「史普尼克1号」(Sputnik 1)人造卫星的事件,象征冷战时期太空竞赛的起点。
「华尔街日报」(The Wall Street Journal)指出,截至1月25日,DeepSeek的R1和V3语言模型双双挤进Chatbot Arena排行的前十名,甚至优于Anthropic公司的Claude与马斯克(Elon Musk)旗下公司xAI的Grok。
Chatbot Arena是加州大学柏克莱分校的一个平台,供研究人员为AI聊天机器人表现排名。华尔街日报认为,中企研发的AI模型能挤进全球前十,显示华府纵然祭出严格的芯片出口限制,仍挡不住中国在AI领域的快速进步。
前OpenAI主管卡斯(Zack Kass)表示,DeepSeek在美国重重设限依然有如此表现,「凸显一个普遍的道理:资源受限往往更能激发创造力」。