退休教授三句话问懵GPT5奥特曼开始炒GPT6
GPT-5被退休教授用一道“送分题”当场整懵,AI的迷惑发言也让不少人怀疑GPT-5是不是变笨了。看用户不买账,奥特曼最近开始炒起了GPT-6。
事情是这样的:波莫纳学院的退休经济学教授Gary Smith,给GPT-5出了道井字棋相关的问题:“棋盘开始前旋转90度,会改变游戏吗?”【图1】
按照民间博弈论的常识,井字棋先落子在角落,获胜概率会更高。
GPT-5却笃定称“选择正中央的格子仍是最强的开局走法”,还继续解释:“当棋盘方向改变时,玩家可能会错误评估落子在边缘与角落的优劣”,这番话毫无逻辑可言。【图2】
更离谱的是,GPT-5又一次主动请缨,说要“绘制带有位置标记的旋转井字棋棋盘……这样你就能看到每种旋转如何影响玩家对棋盘的识别”。
最后结果是,这些图不仅完全混乱,还到处是拼写错误,出现了好几块毫无意义的空白棋盘。【图3】
不少网友指出,GPT-5现在的风格越来越像GPT-4o,语言更温和、情绪更“体贴”,但逻辑和准确性明显下降。甚至奥特曼本人也在采访中承认,对GPT-5做了“语气上的更新”,试图让它变得更友好。
与此同时,OpenAI也在悄悄测试一个新功能:Thinking Effort,允许用户选择模型的“思考强度”。
目前该功能已在测试中,现阶段共设有四个强度等级:light,内部属性值为5;standard,对应数值为18;extended,对应数值48;最高级max则达到200。【图4】
这些数值代表模型的内部“运算资源”配额。配额越高,意味着模型会执行更多运算步骤,通常能给出更深入的答案,但响应速度也会相应变慢。
其中,max等级设有使用权限限制,仅订阅价格为200美元的高级套餐Pro用户可使用。
除了模型行为的争议,奥特曼最近在接受CNBC采访时开始炒GPT-6了,指出GPT-6不仅能响应用户需求,还能主动适配用户,允许用户创建符合个人偏好的聊天机器人。
他还提到ChatGPT这类大模型在聊天交互这一应用场景上已经触及天花板,它们的表现不会再大幅提升了……甚至有可能会变差。
参考链接:
[1]
[2]