退休教授三句话问懵GPT5奥特曼开始炒GPT6GPT-5被退休教授用一道“送分题

退休教授三句话问懵GPT5奥特曼开始炒GPT6

GPT-5被退休教授用一道“送分题”当场整懵，AI的迷惑发言也让不少人怀疑GPT-5是不是变笨了。看用户不买账，奥特曼最近开始炒起了GPT-6。

事情是这样的：波莫纳学院的退休经济学教授Gary Smith，给GPT-5出了道井字棋相关的问题：“棋盘开始前旋转90度，会改变游戏吗？”【图1】

按照民间博弈论的常识，井字棋先落子在角落，获胜概率会更高。

GPT-5却笃定称“选择正中央的格子仍是最强的开局走法”，还继续解释：“当棋盘方向改变时，玩家可能会错误评估落子在边缘与角落的优劣”，这番话毫无逻辑可言。【图2】

更离谱的是，GPT-5又一次主动请缨，说要“绘制带有位置标记的旋转井字棋棋盘……这样你就能看到每种旋转如何影响玩家对棋盘的识别”。

最后结果是，这些图不仅完全混乱，还到处是拼写错误，出现了好几块毫无意义的空白棋盘。【图3】

不少网友指出，GPT-5现在的风格越来越像GPT-4o，语言更温和、情绪更“体贴”，但逻辑和准确性明显下降。甚至奥特曼本人也在采访中承认，对GPT-5做了“语气上的更新”，试图让它变得更友好。

与此同时，OpenAI也在悄悄测试一个新功能：Thinking Effort，允许用户选择模型的“思考强度”。

目前该功能已在测试中，现阶段共设有四个强度等级：light，内部属性值为5；standard，对应数值为18；extended，对应数值48；最高级max则达到200。【图4】

这些数值代表模型的内部“运算资源”配额。配额越高，意味着模型会执行更多运算步骤，通常能给出更深入的答案，但响应速度也会相应变慢。

其中，max等级设有使用权限限制，仅订阅价格为200美元的高级套餐Pro用户可使用。

除了模型行为的争议，奥特曼最近在接受CNBC采访时开始炒GPT-6了，指出GPT-6不仅能响应用户需求，还能主动适配用户，允许用户创建符合个人偏好的聊天机器人。

他还提到ChatGPT这类大模型在聊天交互这一应用场景上已经触及天花板，它们的表现不会再大幅提升了……甚至有可能会变差。

参考链接：

[1]

[2]

0 阅读：1

为什么各国都喜欢模仿中国？F22刚出来的时候，没人模仿，美国朱姆沃尔特级驱逐舰出