如何评价 DeepSeek-R1-0528。
从很多方面来讲,如果论公司,这是一个和 OpenAI 及 GoogleDeepMind 竞争的模型,如果论具体模型,这是一个和 OpenAI o3 及 Gemini 2.5 Pro 竞争的模型。
这些测试集的表现和许多普通用户的反馈都证明了这个结论。
这是开源 AI 领域的再一次登顶,也是中国 AI 的再一次登顶。
用「竞争」而不是「追赶」也很重要,差距够大才好用「追赶」,差距不大还是用「竞争」更准确。
实际上,用 -0528 有一些低调过度,也许 R1.5 是更好的命名,毕竟 OpenAI 甚至都没有 o2。
这个模型证明了在 Test-Time Scaling 的新范式下,DeepSeek 还是可以紧紧咬住全世界算力最富裕的 OpenAI 和 Google,这很重要。