GPT-5.1-Codex-Max拿下Terminal Bench 2.0第一名,60.4%的成绩领先所有对手。对比下来,Warp的混合模型59.1%排第二,Gemini 3 Pro的II-Agent 58.9%第三,差距其实不大但GPT-5.1胜在综合性强。奥特曼曝光后续几周还会有新动作,看来OpenAI这次是认真在代码辅助领域发力了。

GPT-5.1-Codex-Max拿下Terminal Bench 2.0第一名,60.4%的成绩领先所有对手。对比下来,Warp的混合模型59.1%排第二,Gemini 3 Pro的II-Agent 58.9%第三,差距其实不大但GPT-5.1胜在综合性强。奥特曼曝光后续几周还会有新动作,看来OpenAI这次是认真在代码辅助领域发力了。

作者最新文章
热门分类
科技TOP
科技最新文章