专栏名称: 信息平权

理性客观朴素

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

端侧 AI

信息平权 · 公众号 · 科技自媒体 · 2024-06-20 19:26

主要观点总结

本文介绍了关于手机端侧AI LLM的共识与非共识。文章主要讨论了端侧LLM的性能瓶颈、落地难点、应用阻碍、技术领先情况、硬件需求以及特定厂商的LLM策略等。

关键观点总结

关键观点1: 端侧LLM性能瓶颈

文章指出，端侧LLM的性能瓶颈并非在于算力，而是内存速度。每生成一个token需要将模型在内存中读出一遍，因此提高内存速度是提升推理速度的关键。

关键观点2: 端侧LLM落地难点

文章认为，端侧LLM落地的最大阻碍不是技术能力，而是机制和交互。在国内，这可能是机制问题；从全球角度看，则是手机和应用的生态博弈。此外，LLM的交互机制需要文字输入，但大多数手机用户难以通过文字清晰表达自己的想法，这也影响了LLM的交互。

关键观点3: 技术领先情况

文章提到，各家在端侧LLM技术上不存在绝对的领先落后。例如，苹果的3b模型在某些测试中表现并不出色，但从国内技术追赶速度来看，训好一个端侧LLM大约需要一年左右时间，国内的一些公司已经表现出了强大的实力。

关键观点4: 硬件需求

文章强调，更大的硬件拉动可能是对DRAM的需求。更多的离线计算转为实时计算，更复杂的长推理任务，甚至更多的agent并行，这些都需要更强的内存性能。苹果虽然努力优化内存占用，但这个优化出来的空间很快就会被负载所占据。

关键观点5: 特定厂商的LLM策略

文章预测，苹果的端侧LLM有望推动机制进化，改进交互方式，影响用户心智。苹果有可能带动用户更广泛地接受和使用LLM。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

酷玩实验室 · 新疆，你怎么连雪糕都这么好吃！还这么便宜！

5 小时前

雷递 · 俞浩基金会联合清华大学，公布U35青年科学家计划首期名单最高可获50万研发经费

昨天

李楠或kkk · 其实用 AI 写软件项目，对于普通人最大的障碍是两个：1 在需求-20260502182856

昨天

sven_shi · 这婚内强奸在网上就被人搞成剧本了，完全搞反了。婚内强奸一般是缓刑-20260501133934

2 天前

sven_shi · 说实话，在汽车圈混久了，我愈发觉得，真正的竞争力往往都藏在工厂里-20260430204502

3 天前

北极星电力网 · 【重要人事】国家电网副总经理任职

1 年前

跨境营销中心 · 【跨境电商卖家交流群】加入跨境人自己的社群

1 年前

观点 · 定增失败后豫园股份欲脱手日本滑雪度假村

1 年前

医药魔方Info · FGFR2单抗：癌症治疗的新希望

1 年前

唐史主任司马迁 · 我前面一条发完，很多机构站位的人怼我。好，那咱们就事论事。当我们-20241107180124

1 年前