[LG]《BugPilot:ComplexBugGenerationfo

爱生活爱珂珂 2025-10-29 06:32:39

[LG]《BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills》A Sonwane, I White, H Lee, M Pereira... [Cornell University & University of California San Diego & University of North Carolina at Chapel Hill] (2025)

BugPilot：用复杂合成Bug高效训练软件工程技能的创新方法

当前大型语言模型（LLM）在软件工程（SWE）任务上表现卓越，但提升开源模型仍具挑战。高质量Bug数据集是训练下一代SWE智能体的关键。本文提出BUGPILOT，一种利用SWE智能体通过真实开发流程自然引入Bug的合成生成方法，区别于传统刻意注入错误的合成手段，BUGPILOT让智能体在添加新功能时无意间破坏测试，生成更自然、多样且复杂的Bug。

核心创新：

- FEATADD策略：智能体在开发新功能过程中产生无意Bug，模拟真实开发中功能改动引发的复杂缺陷，覆盖多文件、大规模代码改动，且Bug类型分布更接近真实人类提交。

- BUGINSTRUCT对比：刻意指示智能体注入Bug，虽有效但多为简单局部错误，难以匹配真实Bug多样性。

- BUGPILOT结合容器化环境与智能体交互，自动判定测试失败自动收集Bug数据，无需人工筛选，极大提升生成效率。

实验成果：

- FEATADD生成的Bug训练数据，使用量仅为其他方法一半（1.2k vs 3k），在监督微调中性能提升2%。

- 结合FEATADD与现有数据训练出的FROGBOSS（32B参数）和FROGMINI（14B参数）分别在SWE-Bench Verified测试集达到54.6%和45.3%的Pass- 强化学习进一步提升性能，达52.4% Pass- FEATADD数据覆盖十类Bug（API不兼容、逻辑错误、输入验证、状态一致性等），分布均衡，反映真实开发环境。

方法意义：

- 模拟真实开发引发Bug，增强模型泛化能力与实际应用价值。

- 高效生成复杂多样Bug，缓解真实Bug数据稀缺问题。

- 为未来基于智能体的自我训练与任务生成奠定基础，推动软件工程AI自动化进程。

未来展望：

- 用训练好的学生模型自生成训练数据，形成闭环提升。

- 定向生成特定类型Bug，强化模型专项能力。

- 扩展智能体生成范围，涵盖测试生成、代码搭建、协作等多样开发场景。

论文链接：arxiv.org/abs/2510.19898

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

晚安～晚安

2

【如何骗过你的大脑去做困难的事】早上六点，闹钟响了。你知道该起床去健身房，但被窝

3

【Slop Code时代：当人人都能写代码，真正的门槛在哪里？】Naval一句话

4

【当你花了一万小时精进的技能，正在快速变成一种"日用品"】我不确定其他开发者是否

5

【当AI越来越强大，它们是否正在逼近同一个“真实”？】最近被一个叫“柏拉图表征假

6

【告别Few-shot，自我验证才是AI准确性的未来】Meta AI研究人员发现

7

【StackOverflow的终结时刻：AI如何重塑程序员的问答习惯】一张Sta

8

【GPT-5.2 Instant模式的致命缺陷：为什么“快”有时意味着“错”】一

9

【AI垃圾内容的本质：一场关于创作价值的深度辩论】最近Reddit上一篇关于“A

10

【机器人霸主联手：波士顿动力×DeepMind开启人形机器人新纪元】波士顿动力与

热门分类

科技TOP

1

没想到荣耀magic8系列居然还有新机，ProAir！！！原本以为春节

2

2699起，才2699，其中我以为最起码要2999。256版本是满一刀享受限时优

3

2025年终中端机封神！等等党赢麻了✅5款真香机性价比拉满，闭眼冲不亏！✅荣

4

微信更新后最利于单删的功能挺好，算得上微信年度最有用更新了，比直接拉黑名单更狠

5

华为鸿蒙6.0.0.120SP6更新推送，优化了系统使用体验，并且该版本更

6

好奇去查了一下2025年华为销量最高的五款机型。第一名：nova13第二名：n

7

一图看清百度集团品牌矩阵。让大家知道百度没老，只是疲了。

8

前几天刷到荣耀Magic8系列还有mini版，或者Air版。这会看来，是真的。方

9

荣耀Power2对比前代，续航党直接封神‼️✅核心升级2大杀招✅电池：800

10

🔥荣耀杀疯了！沉迷堆大电池根本停不下来7000mAh以上机型直接甩出12款，

科技最新文章

1

数据一出来，库克估计傻眼了，这已经不是超越苹果，而是不给苹果留活路iPhon

2

🔥荣耀杀疯了！全网电池容量TOP7，荣耀直接占三席！WIN系列两款机型100

3

🔥荣耀这波“内斗”太狠了！Magic8和WIN同台竞技，选机困难症直接犯了！

4

鸿蒙6.0最新预告，大家期待一波

5

说实话，当时5G吹得天花乱坠，但是我并没有感觉到5G快4G很多啊。大家觉得呢？

6

荣耀Power2价格公布12+256269912+512299910080m

7

都没想到吧，友商全部被荣耀骗了，真正的布局已经开始荣耀Power2首发了10

8

是不是也跟我一样，被网络黑子骗惨了荣耀Magic8Pro已经当主力机用了好几

9

荣耀Magic8RSR的人像、长焦、微距、夜景样张都出来了，整体质感提升明显，

10

三星GalaxyS26系列大概率会在2月25日发布，比去年晚了差不