《ReasoningBank:ScalingAgentSelf-Evolv

爱生活爱珂珂 2025-10-12 07:05:32

《ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory》

谷歌最新论文《ReasoningBank：基于推理记忆的自我进化AI代理》带来AI记忆革命！

传统大语言模型（LLM）代理处理任务时多为流水线操作，缺乏“记忆”，导致不断重复错误。ReasoningBank框架创新性地将每次操作转化为结构化记忆单元（标题、描述、具体步骤），并根据成功与失败自动总结策略和陷阱。

核心机制是：任务前通过语义检索调用相关经验，任务后由另一个模型判断成败并提炼教训，系统合并优化记忆，避免冗余。配合MaTTS测试时刻扩展技术，进行多次并行或逐步自我优化，显著提升推理准确率和效率。

实测效果惊人：在WebArena、Mind2Web及软件工程基准测试中，成功率提升8-10%，平均步骤减少约16%，意味着AI代理更快锁定正确路径，减少无效尝试。

更重要的是，ReasoningBank不仅记忆“发生了什么”，更注重“为什么成功或失败”，真正实现经验的普适化和策略化。失败不再是噪声，而是宝贵资源。

这标志着AI从单次推理向“持续进化”迈进——记忆不只是存储，更是不断精炼推理的力量。未来AI将不再盲目追求更大模型，而是通过积累智慧与自我反思实现质的飞跃。

详细论文阅读请见：arxiv.org/abs/2509.25140

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

AI正迎来范式转变？过去，大家热衷于调用大型通用语言模型（LLM）API，但现在

2

如何打造一个AI智能体？ ——来自Dhanian的实用拆解1️⃣ 定义目标与环

3

《What Makes 5% of AI Agents Actually Wor

4

Nanonets-OCR2：颠覆传统OCR，智能将文档转为结构化Markdown

5

François Chollet 提出：智能思考的关键步骤是“观察 → 得出结论

6

《Just Talk To It - the no-bs Way of Agen

7

[LG]《How Reinforcement Learning After Ne

8

[LG]《Representation-Based Exploration fo

9

晚安～ [月亮] 晚安

10

《爱可可微博热门分享(10.14)》

热门分类

科技TOP

1

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

2

10月份即将发布的新手机，看看有没有你喜欢的？

3

华为Mate70Pro在某多多上面百亿补贴的价格才四千多？敢不敢买？看上m

4

荣耀不讲武德[捂脸哭]荣耀500系列这是要卷死友商，不仅全系标配2亿大底主摄，电池

5

红米K90真长这样也挺好看的，或许这是前红米品牌总经理王腾的最后“遗作”瞄准高

6

今年mate80是不是还是走mate70路线，11月发布，前期缺货，过几个月供应

7

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

8

有“高人”指点荣耀。荣耀推出“后悔宝”，让用户毋庸担心后悔购买搭载骁龙8ge

9

记住这几个时间点！双11各大平台时间汇总不知不觉，2025年双11又悄悄来了，

10

前几天帮朋友挑1500内手机，线下导购推荐了荣耀GT，说性价比高、销量挺火。查了

科技最新文章

1

【荣耀Magic8系列炸场配置曝光！这价格真的绷不住了？】🔥骁龙8El

2

董宇辉卖华为手机，说激活了就不能退，评论区却有人说“官旗激活了可以退”，董宇辉问

3

摊牌了，马斯克不装了！10月13号，马斯克又有新动静了，这次全是关于他那个“

4

AI喜欢被粗鲁对待AI被骂反而更听话破案了，AI其实更喜欢被“粗鲁对待”。对AI

5

昨天同学聚会，看着他们的老公都拿的苹果17，我老公还拿着好几年前的苹果11呢，我

6

年底打算换新机，开始在vivoX300Pro、OPPOFindX9Pr

7

记住这几个时间点！双11各大平台时间汇总不知不觉，2025年双11又悄悄来了，

8

荣耀演都不演了，新机还没发布，线下样机就能体验了，这产品力自信的，怪不得高管喊话

9

我单方面宣布，荣耀Magic8是最强旗舰标准版新机，没有之一OPPOFind

10

这么一看，红米K90Pro要吊打小米17？好家伙，据说红米K90Pro这一次