专栏名称: AI前线

InfoQ十年沉淀，为千万技术人打造的专属AI公众号。追踪技术新趋势，跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

X平台RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

TodayRss-海外稳定RSS

代码里插广告，腾讯 Codebuddy 们 “背锅”？DeepSeek “极你太美”事件，其他模型也...

AI前线 · 公众号 · AI · 2025-08-27 13:40

主要观点总结

本文报道了DeepSeek模型出现的bug，该bug会在生成的代码中插入随机的“极”字。网友们实测发现，官方API能够复现该bug，概率不高但需要多次尝试。网友表示此bug可能涉及到数据清洗的问题。一些开发者猜测这是预训练或合成数据的问题导致的，也可能涉及到模型蒸馏过程中的数据污染。开发者表示未来需要对整个数据链条进行更严格的监控和清洗。

关键观点总结

关键观点1: DeepSeek模型出现bug，会在生成的代码中插入随机的“极”字。

此bug被广大网友戏称为“极你太美”事件。

关键观点2: 官方API能够复现该bug，但概率不高。

网友实测发现，第三方平台上的复现率较高。

关键观点3: 一些开发者猜测该bug与数据清洗有关，可能涉及到预训练或合成数据的问题。

开发者猜测模型把“极”当成边界token使用，这种行为与自然语言生成有差距。

关键观点4: 开发者认为这种“极”现象很有研究价值，可以了解模型如何在语料噪声中形成“伪语言规则”。

未来需要对整个数据链条进行更严格的监控和清洗，避免类似问题再次发生。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新智元 · 刚刚，大模型装上「鹰眼」！首创高刷视频理解，谷歌Gemini 2.5完败

18 小时前

图灵人工智能 · 超97万：图灵奖得主Yoshua Bengio成历史被引用最高学者，何恺明进总榜前五

昨天

Robot猎场备忘录 · 浅谈，「京东」在具身智能赛道布局

2 天前

人工智能产业链union · 【AI】GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

2 天前

青稞AI · 如何理解 RL Off-Policy 优化中的重要性采样？

2 天前

科普中国 · 比“公园20分钟”更解压的小事，0成本！做了立刻就能开心

1 年前

ShenzhenLOOK · 演出 | 音乐剧明星「约翰·欧文-琼斯」音乐会 · 深圳开唱

9 月前

sven_shi · 房屋养老金是个很经典的问题。房屋养老金：房产估值的新困境 -20250221184241

6 月前

安徽商报 · 就像哪吒中了“穿心咒”！春节后患者猛增！这类人要特别注意……

6 月前

中汽协会数据 · 【统统告诉你】GDP研究所：带你了解“既熟悉又陌生”的ta

6 月前