今天看啥  ›  专栏  ›  新皮层NewNewThing

DeepSeek新模型能将语言再压缩90%;Karpathy不再鼓吹Vibe Coding,说Age...

新皮层NewNewThing  · 公众号  · 科技创业 科技自媒体  · 2025-10-21 20:05
    

主要观点总结

本文报道了国内DeepSeek发布的OCR模型、宇树发布的第二代全尺寸人形机器人、iPhone 17标准版在中国的销量、Andrej Karpathy对AI的看法、Lilian Weng的创业项目以及亚马逊云服务中断等科技新闻。

关键观点总结

关键观点1: 国内DeepSeek发布新的OCR模型,可将视觉上下文压缩至原始信息量的1/10以下,提高信息压缩率。

DeepSeek-OCR模型将传统以语言序列处理的文字转换为图像识别,显著降低了大模型的计算开销。该模型可用于对话式AI的「记忆压缩」,通过降低旧对话的分辨率以保留语义主干。

关键观点2: 宇树发布第二代全尺寸人形机器人H2,关节数量较上代增加63%,具备更高的灵活性和运动能力。

H2机器人身高180厘米,配备31个关节,能在保持人类水平上肢运动能力的同时,完成复杂的动作。此外,H2还增加了仿生人脸,外观和功能更接近科幻电影中的机器人形象。

关键观点3: iPhone 17标准版在中国市场的销量较iPhone 16翻倍,但在美国并未出现同样情况。

iPhone 17标准版的销量增长得益于其更好的芯片、改进的显示屏、更高的基本存储空间以及升级后的自拍相机。此外,苹果在中国市场的营销策略也可能促进了销量。

关键观点4: Andrej Karpathy对AI的看法,他认为当前的Agent存在认知缺陷,没有持续学习能力,并需要10年时间来创建一个真正像秘书一样工作的Agent。

Karpathy还批评了强化学习的效率问题,并指出尽管现阶段强化学习仍是训练模型的最佳方法,但研究者应探索更优质的路径。他认为AI在编程场景中常常会误解用户需求,把代码复杂化。

关键观点5: Lilian Weng强调研究工作也需要创造「现实扭曲力场」,她的创业项目Thinking Machines Lab致力于将前沿多模态模型与高可靠训练基础设施做成「人人可用、可定制」的能力平台。

Weng荔在离开OpenAI后,通过创建Thinking Machines Lab,希望将复杂的技术变得更容易被大众接受和使用。她的团队最近发布了「Tinker」训练API,旨在帮助研究者更轻松地完成模型的微调与实验。

关键观点6: 亚马逊云服务经历约15个小时的服务中断后恢复正常运行,中断原因系亚马逊北部弗吉尼亚州数据工厂的DNS域名系统发送错误。

这次服务中断影响了多个知名公司和应用程序,包括亚马逊、Snapchat、Facebook等。此次事件再次提醒人们云服务的重要性和潜在的风险。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照