专栏名称: arXiv每日学术速递

工作日更新学术速递！官网www.arxivdaily.com。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

arXiv每日学术速递 · 公众号 · 科技创业科技自媒体 · 2025-06-27 14:22

主要观点总结

谷歌发布了全新的端侧多模态大模型 Gemma 3n，该模型为手机、平板、笔记本电脑等端侧设备带来了强大的多模态功能。Gemma 3n具有多模态设计、专为设备端优化、架构突破、质量提升等特点。

关键观点总结

关键观点1: Gemma 3n 的发布和特性

Gemma 3n是谷歌新发布的端侧多模态大模型，具有多模态设计、专为设备端优化、架构突破、质量提升等特点。

关键观点2: Gemma 3n 的核心架构

Gemma 3n的核心架构包括 MatFormer（Matryoshka Transformer）架构、逐层嵌入 (PLE) 技术和键值缓存共享 (KV Cache Sharing)。这些技术提高了模型的性能、内存效率和推理速度。

关键观点3: Gemma 3n 的性能提升

与去年的云端先进模型相比，Gemma 3n 在多语言、数学、编码和推理方面实现了质量提升。E4B 版本的 LMArena 得分超过 1300，成为首个达到此基准的 100 亿参数以下模型。

关键观点4: MatFormer架构的特点

MatFormer架构是一种新型嵌套Transformer，可以适应不同硬件限制和推理需求。它允许开发者根据需要创建不同尺寸的模型，并在 E4B 和 E2B 推理路径之间动态切换，以优化性能和内存使用。

关键观点5: 逐层嵌入 (PLE) 技术的优势

PLE技术专为设备部署而设计，可大幅提高模型质量，同时不会增加设备加速器所需的高速内存占用。它使得Gemma 3n能够在内存占用较低的情况下运行，提高了模型的实用性。

关键观点6: 键值缓存共享 (KV Cache Sharing) 的作用

KV Cache Sharing旨在加快流式响应应用的首个 token 获取时间。通过优化模型处理初始输入的方式，Gemma 3n能够更快地提取和理解较长的提示序列。

关键观点7: Gemma 3n 的视觉编码器

Gemma 3n配备了最新的高效视觉编码器MobileNet-V5-300M，为边缘设备上的多模态任务提供最先进的性能。该编码器支持多种输入分辨率，具有通用视觉理解和高吞吐量的特点。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

扑克财经Club · 【报名】8月18-22日江西碳酸锂调研，掌握行业真实状况！

昨天

精英讲书 · 创新团队| 精英讲书

昨天

李楠或kkk · 当年乔丹第一次夺冠，我是租录像带看的比赛。还多亏了我们班有一个身-20250801214455

2 天前

Switch头号玩家 · Switch 2首月销量公布！一个月卖出超580万台

2 天前

商学院 · 2025上海具身智能机器人产业大会启幕在即，福利加码，速抢人机共融千亿赛道入场券!

2 天前

云知富业 · 快速吸金玩法，一单￥300+，轻松月入过万！

1 年前

欧洲并购与投资 · BioNTech公司在mRNA癌症疫苗方面取得重大进展

1 年前

佰傲谷BioValley · Biotech上岸，需要放弃什么？

11 月前

柠檬心理FM · 线上心理咨询就选这些心理咨询师

6 月前

安徽农业大学 · 2025遇见安农 | 现代农业多姿多彩，机会无限，大有可为。安徽农业大学农学院欢迎您！

1 月前