【[60星]CURE:用强化学习让LLM学会写代码和生成单元测试,提升编程能力。亮点:1. 仅用4.5K样本训练,性能超越同规模Qwen和DeepSeek;2. 单元测试器无需真实代码,自动从错误中学习;3. 提供完整数据集、训练代码,支持多种评估方式】
'Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning'
GitHub: github.com/Gen-Verse/CURE
强化学习 代码生成 单元测试 人工智能 ai兴趣创作计划