专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Transformer迎来新挑战者？谷歌发布新架构，用一半内存实现推理速度翻倍

DeepTech深科技 · 公众号 · 科技媒体 · 2025-07-17 17:07

主要观点总结

DeepMind和KAIST联合发布了一种新型语言模型架构MoR，旨在提高语言模型的推理速度和降低训练和部署成本。该架构结合了递归计算和动态路由机制，允许不同的token根据复杂度接受不同深度的处理，同时优化参数效率、内存管理和计算负载。

关键观点总结

关键观点1: MoR架构的核心创新

将递归计算与动态路由机制相结合，解决多重效率问题，允许不同的token根据自身的复杂度接受不同深度的处理。

关键观点2: MoR架构的参数效率提升

通过共享参数块和提升参数效率，同时采用“路由器”来决定每个token需要的递归计算次数。

关键观点3: MoR的内存管理改进

提出了两种新的KV缓存策略来降低内存占用和数据读写量，通过递归式缓存和递归共享策略优化内存使用。

关键观点4: MoR的实验结果

在多项少样本学习任务中，MoR架构的模型性能超过基准Transformer模型，同时实现了推理速度翻倍、训练计算量减少和降低了KV缓存内存使用。

关键观点5: MoR的发展背景

基于谷歌早前的相关研究铺垫，如Mixture-of-Depths技术，MoR延续了AI效率优化的探索，从单一维度转向多个维度的协同优化。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新浪科技 · 【#哪吒2全网上线1小时破400万次##哪吒2线上新增未公开片段-20250802163000

昨天

新浪科技 · 【#研究称172种疾病与6种睡眠特征相关#，高质量睡眠对健康多么-20250802120000

昨天

广州广播电视台 · 任何“不缴社保”的约定均无效！最高法明确→

昨天

新浪科技 · 【#乘龙卡车再回应理想i8撞重卡#】#乘龙卡车呼吁理性看待#8月-20250801210400

昨天

新浪科技 · #加快推进价格法修订# 【国家发改委：#将重点整治为排挤竞争对低-20250801190000

昨天

界面新闻 · 上海浦东机场口岸进出境旅客数量翻番，日本赴华咨询电话“打爆了”

8 月前

福海县公安局交通警察大队 · 【护航春节平安出行】2025年春节假期我县道路交通平稳有序

5 月前

舶乐汇ONBOX · 《舶乐汇100位设计师朋友》征集活动：寻找值得被发现的宝藏设计师！

5 月前

浙江引才 · 浙江水利水电学院拟聘用人员公示

1 月前

中国十五冶 · 中色沈矿到中国十五冶开展座谈交流

1 月前