专栏名称: 京东科技技术说
京东科技官方技术公众号,传递最佳实践&技术创新。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  京东科技技术说

全球Top3正式开源|JoyCode:SWE-bench Verified打榜技术报告

京东科技技术说  · 公众号  · 程序员  · 2026-01-09 17:12
    

主要观点总结

JoyCode Agent凭借74.6%的高通过率,在全球SWE-bench Verified基准测试中取得佳绩,并正式开源。该Agent采用补丁–单测协同生成与迭代验证策略,显著提升了补丁正确率和修复覆盖率。它解决了传统提示词工程在仓库级任务上的失效问题,通过动态测试协同生成、原仓预验证、轨迹压缩与CSR检索、二轮重试等步骤,形成了高质量的补丁池与可复现的工程Pipeline。系统结构包含Patch Agent、Testing Agent、CSR Agent和Decision Agent四个核心智能体,它们协同工作,实现了从问题理解到补丁生成的完整流程。Patch Agent通过代码编辑、Bash工具和思维链工具,实现了代码补丁的生成和验证。Testing Agent负责生成三种不同目的的测试用例,对补丁进行全面、可靠的评估。CSR Agent通过轨迹压缩、根因决策、CSR相似度检索和经验重试,为Patch Agent提供指导,优化新补丁的生成。Decision Agent在重试机制产生两个候选补丁时,通过比较投票,选择最优的解决方案。整个系统通过自动化测试、验证、失败归因和经验迁移,实现了高质量的自动修复。

关键观点总结

关键观点1: JoyCode Agent的高通过率与开源

JoyCode Agent凭借74.6%的高通过率,强势登榜全球Top3,并正式开源,展现了卓越的复杂编程问题解决能力。

关键观点2: 补丁–单测协同生成与迭代验证策略

采用补丁–单测协同生成与迭代验证策略,提高了补丁正确率和修复覆盖率,解决了传统提示词工程在仓库级任务上的失效问题。

关键观点3: 系统结构与核心智能体

系统结构包含Patch Agent、Testing Agent、CSR Agent和Decision Agent四个核心智能体,它们协同工作,实现了从问题理解到补丁生成的完整流程。

关键观点4: Patch Agent的功能与工具设计

Patch Agent通过代码编辑、Bash工具和思维链工具,实现了代码补丁的生成和验证。

关键观点5: Testing Agent的测试用例生成与验证

Testing Agent负责生成三种不同目的的测试用例,对补丁进行全面、可靠的评估,确保补丁的有效性。

关键观点6: CSR Agent的经验检索与重试策略

CSR Agent通过轨迹压缩、根因决策、CSR相似度检索和经验重试,为Patch Agent提供指导,优化新补丁的生成。

关键观点7: Decision Agent的投票决策

Decision Agent在重试机制产生两个候选补丁时,通过比较投票,选择最优的解决方案。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照