ChatGPT转型计划曝光GPT将变身行动助手
“AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。”
这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。
他表示,ChatGPT将从回答问题转变为为用户做事。
也就是说,AI Agent不再满足于30s回答问题,而是通过浏览网页、深度思考、推理总结以解决更复杂的问题。
以下是本次访谈的高光内容:
- 推理模型的突破在于穿插使用工具
OpenAI正在做的事情就是让DeepResearch能够同时连接到网络和内部知识源,比如Google文档、Sharepoint、Jira等。
AI Agent能够整合所有的这些内容,甚至可以跨服务操作让他们一起变得更有用。
Kevin Weil提到,模型可以根据需要使用各种不同的工具。
比如,你想要AI帮你查询信息并通过图表的形式反馈,首先,Agent会先通过搜索工具获取大量的数据,然后通过编程工具编写一个小的Python程序用于绘制图像,那么就需要知道编写程序的知识,这时候它就会继续搜索关于编程的信息进行推理,然后继续完成代码编写。
在这个过程中,AI不仅可以调用所需要的代码库,甚至可以从零开始编写一个库。
像这样,Agent能够擅长穿插使用解决问题需要的各种工具,将所有东西整合成一个最终的答案。
这对于AI Agent的功能来说是一种巨大的“解锁”。
- 模型训练成本
目前有两种方式来扩展模型的智能。
一种就是传统方法,通过越来越大规模的预训练来提升模型的性能,虽然这种方法很有效,但非常昂贵;还有一种方法就是让模型思考更长时间。
在两种方法中的任一方向上改进都可以提升模型性能。
在成本方面,如果将几年前最初推出的GPT-4与现在的一些型号进行比较,则存在500倍的成本差异。
Kevin Weil表示,OpenAI将尽可能不断降低API价格,让更多的公司能够参与到AI领域的发展中。
- 降低AI模型的成本,是否会减少计算的使用呢?
从训练后的角度来看,模型的效率突破在于硬件的提升和算法的改进,模型变得更聪明,模型越智能越安全,那么成本也会下降。
关于情报安全性的问题,在训练模型过程中,一方面是用更科学的方式进行,另一方面是推理模型会用不同的方式仔细检查它们的答案,因为现在它们可以使用工具,也可以搜索网络,这样就会减少幻觉。