专栏名称: 知乎日报

提供最好的资讯评论，兼顾专业与趣味。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

科技丨DeepSeek or Qwen：大模型长文本技术路线中，谁代表未来？

知乎日报 · 公众号 · 问答 · 2025-10-14 21:00

主要观点总结

本文讨论了关于稀疏注意力机制和线性注意力机制在大模型未来方向上的讨论。DeepSeek使用的稀疏注意力机制和Qwen3-Next使用的线性注意力机制各有优点，引发知友们的热烈讨论。知友们还提到了混合注意力机制的可能性以及不同注意力机制的结合等话题。

关键观点总结

关键观点1: 稀疏注意力机制和线性注意力机制的优势与局限

稀疏注意力机制能够节省计算资源，但在实际运行中可能存在速度问题。线性注意力机制追求更快的长文本处理能力，但在处理大规模文本时效果可能打折扣。

关键观点2: 知友们的不同观点

知友们对这两种机制都有关注，并从实际应用、长期发展和技术路线等方面提出了自己的看法和预测。有人认为短期内稀疏注意力机制更稳定，而线性注意力机制在创新方面有很大潜力。还有知友提到了混合注意力机制的可能性，以及不同注意力机制的结合等话题。

关键观点3: 其他相关话题

知友们还讨论了AI领域的其他话题，如AI产品的扶持计划、AI社群、知乎科技账号正式登陆X等。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

知乎 · 在人人都是「创作者」的时代，新知从哪里来？TA 来自现场，来自追-20260504100000

17 小时前

知乎 · 网友建议想减肥的人去趟云南，高原地区加速代谢，建议背后有科学依据-20260504110000

16 小时前

知乎 · 人人都是创作者，新知从哪里来？或许从一次次追问与记录真相的执念中-20260504120000

15 小时前

知乎 · 主编优选第一期名单揭晓！第五届长篇创作马拉松「主编优选」第一期，-20260503120000

昨天

知乎日报 · 生活丨明明狗的服从性更高，为什么周围养猫的人越来越多？

2 天前

无讼研究院 · 遗产是天上掉的馅饼吗？——遗产继承的路径及案例丨无讼晚8点

1 年前

海胆新闻 · 刚刚，2025辽视春晚节目单来了！

1 年前

987私家车广播 · 印度一航班飞10小时后突然返航！“10个厕所9个堵”，300多名乘客用一个卫生间，停留2天大量消杀后重新起飞

1 年前

普哈聊事 · 鸿蒙电脑，来了！

11 月前

萧山网 · 注意！今年或破历史极值！多地紧急发出提醒

11 月前