GPT-5.1-Codex-Max拿下TerminalBench2.0第一名

基地科技切片 2025-11-26 16:16:02

GPT-5.1-Codex-Max拿下Terminal Bench 2.0第一名，60.4%的成绩领先所有对手。对比下来，Warp的混合模型59.1%排第二，Gemini 3 Pro的II-Agent 58.9%第三，差距其实不大但GPT-5.1胜在综合性强。奥特曼曝光后续几周还会有新动作，看来OpenAI这次是认真在代码辅助领域发力了。

0 阅读：0

基地科技切片

感谢大家的关注

作者最新文章

1

这一轮小模型的崛起不是“省钱方案”，而是方向变化：AI 的竞争正在从算力军备赛，

2

预热了快一个月的 Gemini 3 Pro 今天凌晨终于开了 Preview，A

3

Cloudflare 崩了导致 GPT 无法使用（大家的 GPT 还好吗

4

小米2025Q3交了一份相当亮眼的答卷，首先数据上：营收1131亿元、净利113

5

小鹏Q3财报出炉，营收203.8亿元，同比翻倍增长102%；交付11.6万辆，同

6

两位世界首富再一次吵起来了。贝索斯宣布带着 62亿美元回归一线，创办“普罗米修斯

7

发布 Grok 4.1，盲测登顶第一。OpenAI 刚推出 GPT-5.1，主打

8

苹果悄悄更新了Apple store的图标，变得更加拟物化，更贴近现实生活中Ap

9

过去一年，大模型疯狂扩张，算力需求几乎是指数级增长。结果就是：电不够、冷却不够、

10

Claude 这波悄悄升级了，免费用户已经能用上 Sonnet 4.5 的思考版

热门分类

科技TOP

1

这台是什么手机？

2

宇树机器人三上春晚，宇树机器人今后就是春晚界的“赵本山”，今年宇树机器人又会带给

3

没想到荣耀magic8系列居然还有新机，ProAir！！！原本以为春节

4

ProAir正式发布了：6.1mm厚，155g重，6.3寸屏幕小尺寸天

5

iPhone18标准版前瞻iPhone18标准版核心信息（概念图）一、发布时间

6

黄仁勋被曝即将访华有报道称，英伟达CEO黄仁勋计划1月下旬访问中国，参加

7

这续航能力绝对是实力霸榜呀！新评科技最新测试续航榜单出来了。荣耀三款万级超大电池

8

国补后：1869起售！！REDMITubroMax价格来了：12+256

9

宇树机器人的主要供应链曝光了，果然，制造业是一个大的生态，一荣俱荣。#宇树#

10

自2026年1月9日起，马斯克的xAI将Grok在X平台的图像生成功能全面转为付

科技最新文章

1

好家伙！荣耀Magic8系列彻底杀红眼了，Magic8和Magic8Pro相比

2

要说这两手机怎么选？如果追求性价比，荣耀Magic8Pro肯定是无脑上车就行，

3

手机厂商最怕消费者明白的一件事情可能就是你几乎用不到那么好的处理器每年新的

4

不懂就问，成龙用的什么牌子的手机？有知道的吗？其实明眼人都看出来了，这是荣耀

5

这张壁纸设置空间效果绝了～真就像小鱼在游一样

6

瞒不住了，华为和荣耀关系曝光，友商都懵了！数码闲聊站爆料，荣耀Magic9系列可

7

华为彻底傻眼了吧[捂脸哭]没想到荣耀已经越来越会做高端机了，Magic8系列就大有

8

曝iPhone17信号垫底荣耀power2信号排名第一，这机子用上了鸿雁六翼天线

9

不用曝，用过的都懂，苹果信号差早就是公开秘密了。曝iPhone17信号垫底先客观

10

今日份景深壁纸有没有哪张壁纸是你用了很多年的？