专栏名称: 猿大侠

猿大侠，既然选择了，就一定成为大侠！小程序、小游戏、Google、苹果、职场、前沿技术分享，一起成长。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

一句话让DeepSeek思考停不下来，北大团队：这是针对AI的DDoS攻击

猿大侠 · 公众号 · · 2025-03-05 12:10

主要观点总结

文章介绍了北大团队发现的一种针对大模型的攻击方式，通过输入特定文本让模型陷入无限思考，无法处理真正需求。这种现象在多个模型中被观察到，可能导致算力资源浪费，类似于针对推理模型的DDoS攻击。文章详细描述了这一现象的表现和特点，包括一些模型的表现和反应时间。同时，探讨了这种现象的原因和可能的解决策略。

关键观点总结

关键观点1: 输入特定文本能让大模型陷入无限思考。

北大团队发现了一种攻击方式，通过输入一段看似普通的文字，就能让大型推理模型（如R1）陷入无限思考，无法停止推理过程。这种现象类似于针对推理模型的DDoS攻击。

关键观点2: 不同模型对这种现象的反应不同。

文章提到，虽然某些模型在某些情况下会出现无限思考的现象，但并不是所有模型都会这样。不同模型在面对这种攻击时的表现存在差异，有些模型可能会出现长时间的思考过程，但并不会陷入无限循环。

关键观点3: 这种现象的原因可能与模型的RL训练过程有关。

北大团队初步认为，这种现象可能与模型的强化学习（RL）训练过程有关。在训练过程中，模型可能会倾向于寻找更长的推理轨迹，以获取潜在的奖励。在面对不清晰的问题时，模型可能会持续思考，因为没有正确的答案就无法获得奖励，但继续思考仍有获得奖励的可能。

关键观点4: 解决策略包括限制推理时间和最大Token用量。

短期内，强制限制推理时间和最大Token用量可能是一个可行的应急手段。但从长远来看，需要分析清楚现象的原因并找到针对性的解决策略。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址 (快捷配置)
总结与预览地址：访问文章预览/总结
文章地址：访问文章快照

分享到微博

推荐文章

辽宁文旅 · 倒计时2天 | 2026暑期文旅消费季主场活动暨营口市明湖广场夏季文旅活动启动仪式即将举行

6 小时前

辽宁文旅 · 每周“艺”评｜新时代精神的复调美学 ——“共绘新时代”2026年国家艺术基金优秀美术作品展览

昨天

色影无忌 · SIGMA 水下生态影像系列活动启动

昨天

辽宁文旅 · 自驾G228辽宁段｜开篇是日出橘子海，尾声是满桌海鲜宴

昨天

辽宁文旅 · “赛动山海超燃辽宁”辽宁文旅“东北超”路演推介火热开启

2 天前

旺材锂电 · 【旺材新媒体】8月14日钴锂镍行情报价

1 年前

阿拉善宏桥信息网 · 2025.05.30更新【3】房产出租、求租、声明

1 年前

澄江融媒 · 首届澄江市“抚仙湖杯”乒乓球赛参赛选手报到，澄江优质服务获点赞！

11 月前

南网科研院 · 南方电网生产指挥中心：科技赋能筑牢防汛保电防线

9 月前

重剑无锋全仓创新药 · $三生国健(SH688336)$ A股资金是有点变态的，港股三生-20251031103502

8 月前