中国开源AI强势崛起,OpenAI坦言竞争压力空前 美国对中国人工智能实力的低估,正成为科技竞争中的致命盲点。 OpenAI首席执行官山姆·奥尔特曼(Sam Altman)罕见公开表达了对中国AI进步的担忧。他在接受CNBC采访时直言,美国可能低估了中国在人工智能领域取得进展的复杂性和严重性。 他认为,仅仅依靠芯片出口管制无法有效遏制中国AI的发展。“你可以对某个环节实施出口管制,但或许未必精准……也许人们会建立晶圆厂或找到其他变通办法。” 01 中国AI进展:奥尔特曼的担忧 奥尔特曼坦言:“我很担心中国(的实力)”。他指出,美中AI竞赛已经“深深纠缠在一起”,其影响远超过简单的“谁领先”这种排行榜。 他特别强调,中国在推理能力方面可能构建得更快,同时还有研究能力和产品化水平等多个层面的竞争。 奥尔特曼对芯片管制的效果表示怀疑。当被问及进一步减少对华GPU供应是否会奏效时,他直言:“我的直觉是,这行不通。” 02 开源模型的崛起:DeepSeek的成本革命 中国AI初创企业深度求索(DeepSeek)近期发布了其升级版大语言模型DeepSeek V3.1,展示了中国在AI领域的快速进步。 这款模型具有6850亿参数,能处理12.8万个token的上下文,相当于一本厚书的体量。在Aider编码测试中,V3.1取得了71.6%的成绩,与OpenAI和Anthropic的领先模型持平。 最令人印象深刻的是其成本优势:完成一次编码任务仅需约1美元,而竞争对手则收取近70美元。 03 开放战略:中美路径的分化 DeepSeek采用“开放权重”策略,在特定条件下分享模型参数。这与一些西方公司更为保守的做法形成鲜明对比。 奥尔特曼承认,中国开源模型的竞争是OpenAI最近决定发布自己的开放权重模型的关键因素之一。 “如果我们不这样做,世界将会主要建立在中国的开源模型之上。”他如此解释OpenAI的战略转变。 04 阿里巴巴的开源贡献 中国科技巨头阿里巴巴也积极参与开源生态建设,近期开源了三款自主研发的大模型:Qwen2.5、Qwen2-VL和Qwen-Audio。 这些模型覆盖了文本、视觉与音频三大领域,形成了“全模态”技术矩阵。其中Qwen2.5在MMLU基准测试中以87.3%的准确率刷新了开源模型纪录,接近GPT-4的88.1%。 阿里巴巴选择全量开源模型权重与训练代码,并配套发布详细的技术白皮书,与部分国际企业“闭源+API调用”的商业模式形成鲜明对比。 05 芯片管制下的创新突围 尽管美国实施了高端GPU禁售措施,中国AI企业仍然找到了发展路径。 DeepSeek通过优化训练过程,成功应对了美国的芯片出口限制。其原始V3模型仅用600万美元就训练完成,仅是OpenAI的GPT-4据说花费1亿美元的很小一部分。 这种效率提升得益于混合专家(MoE)层等技术创新,以及从计算机科学以外多个领域招募人才。 DeepSeek V3.1在发布几小时内就登上了Hugging Face趋势榜,来自亚洲、欧洲和北美等地的开发者纷纷开始测试和研究其构建。 这让人回想起软件早期开放平台开始超越闭源平台的时代。 更广泛的接入使得任何一个公司或国家都更难保持长期领先地位。开源AI正在通过广泛协作推动进步。
中国开源AI强势崛起,OpenAI坦言竞争压力空前 美国对中国人工智能实力的低
数学指南针
2025-08-20 18:58:32
0
阅读:14