GoogleGemini新版登顶大模型竞技场 日前,GoogleGemi

绮梅谈科技 2025-06-07 17:33:07

Google Gemini 新版登顶大模型竞技场 日前,Google Gemini 2.5 Pro 宣布推出新版本「Gemini 2.5 Pro(0605)」。 性能表现上,Gemini 2.5 Pro 新版在代码、推理等任务表现更强: -在 Humanity’s Last Exam(人类最后的考试)中,以 21.6% 的成绩超越 OpenAI o3;在 GPQA 测试中,以 86.4% 的成绩位居榜首。 -大模型竞技场中,Gemini 2.5 Pro 新版在 Elo 评分上,相较于 (0506) 版本提升了 24 分(达到 1470 分),保持领先地位。 据 Google 介绍,本次 (0605) 版本是基于今年 I/O 大会上公布的 (0506) 版本所构建,并且新版有望成为 Gemini 2.5 Pro 的正式稳定版「出道」。 另外,Google 还给新版 2.5 Pro 进行了回答改进,目前它可以提供更富有创意且格式更优的答复。

0 阅读:1
绮梅谈科技

绮梅谈科技

感谢大家的关注