全球Top3正式开源｜JoyCode：SWE-bench Verified打榜技术报告

京东科技技术说 · 公众号 · 程序员 · 2026-01-09 17:16

主要观点总结

JoyCode Agent凭借74.6%的高通过率，在全球SWE-bench Verified基准测试中取得佳绩，并正式开源。该Agent采用补丁–单测协同生成与迭代验证策略，显著提升了补丁正确率和修复覆盖率。它解决了传统提示词工程在仓库级任务上的失效问题，通过动态测试协同生成、原仓预验证、轨迹压缩与CSR检索、二轮重试等步骤，形成了高质量的补丁池与可复现的工程Pipeline。系统结构包含Patch Agent、Testing Agent、CSR Agent和Decision Agent四个核心智能体，它们协同工作，实现了从问题理解到补丁生成的完整流程。Patch Agent通过代码编辑、Bash工具和思维链工具，实现了代码补丁的生成和验证。Testing Agent负责生成三种不同目的的测试用例，对补丁进行全面、可靠的评估。CSR Agent通过轨迹压缩、根因决策、CSR相似度检索和经验重试，为Patch Agent提供指导，优化新补丁的生成。Decision Agent在重试机制产生两个候选补丁时，通过比较投票，选择最优的解决方案。整个系统通过自动化测试、验证、失败归因和经验迁移，实现了高质量的自动修复。

关键观点总结

关键观点1: JoyCode Agent的高通过率与开源

JoyCode Agent凭借74.6%的高通过率，强势登榜全球Top3，并正式开源，展现了卓越的复杂编程问题解决能力。

关键观点2: 补丁–单测协同生成与迭代验证策略

采用补丁–单测协同生成与迭代验证策略，提高了补丁正确率和修复覆盖率，解决了传统提示词工程在仓库级任务上的失效问题。

关键观点3: 系统结构与核心智能体

系统结构包含Patch Agent、Testing Agent、CSR Agent和Decision Agent四个核心智能体，它们协同工作，实现了从问题理解到补丁生成的完整流程。

关键观点4: Patch Agent的功能与工具设计

Patch Agent通过代码编辑、Bash工具和思维链工具，实现了代码补丁的生成和验证。

关键观点5: Testing Agent的测试用例生成与验证

Testing Agent负责生成三种不同目的的测试用例，对补丁进行全面、可靠的评估，确保补丁的有效性。

关键观点6: CSR Agent的经验检索与重试策略

CSR Agent通过轨迹压缩、根因决策、CSR相似度检索和经验重试，为Patch Agent提供指导，优化新补丁的生成。

关键观点7: Decision Agent的投票决策

Decision Agent在重试机制产生两个候选补丁时，通过比较投票，选择最优的解决方案。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博