今天看啥  ›  专栏  ›  硅星GenAI

Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿

硅星GenAI  · 公众号  ·  · 2025-06-17 19:34
    

主要观点总结

本文介绍了开源代码模型Kimi-Dev-72B的发布及其相关争议。该模型在软件工程任务基准测试上取得了优异成绩,但其表现引发了关于创新还是“套壳”的疑问。文章详细描述了Kimi-Dev的技术特点、训练方法和在SWE-bench Verified上的表现,同时介绍了其开源策略背后的历史遗留问题以及未来的发展趋势。

关键观点总结

关键观点1: Kimi-Dev-72B模型发布和性能

模型基于Qwen团队的基础模型进行二次开发,采用大规模强化学习技术训练,在软件工程任务基准测试上取得了60.4%的成绩,创下开源模型新纪录。

关键观点2: 关于“套壳”的争议

社区对Kimi-Dev-72B是否基于Qwen-2.5-72B产生质疑,引发关于创新性和使用许可的讨论。

关键观点3: Qwen团队许可策略的历史遗留问题

Qwen团队历史上的分级许可策略导致了一些误解和争议,但在Qwen3系列中所有模型采用了更加开放的Apache 2.0协议。

关键观点4: 开源协作的新范式

大厂与创业公司在开源生态中形成新的协作模式,基于优秀基础模型的“二次创新”正在兴起。

关键观点5: 实际应用中的改进空间

尽管Kimi-Dev在SWE-bench上取得了优异成绩,但实际应用中仍有改进空间,需要更多创新来做出真正优秀的垂直应用。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照