专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20251217

腾讯研究院  · 公众号  · 科技媒体  · 2025-12-17 00:32
    

主要观点总结

这篇文章涵盖了多个关于人工智能的热点话题,包括苹果首款AI服务器芯片的曝光、英伟达推出Ne‌motron 3系列开源模型、ChatGPT记忆系统的逆向破解、元宝写作模式的推出、通义万相Wan 2.6角色扮演功能的发布、字节跳动音视频创作模型的发布、我国首批L3级自动驾驶车型的准入许可、谷歌前CEO的观点以及AI在视觉推理方面的缺陷等。

关键观点总结

关键观点1: 苹果首款AI服务器芯片曝光,采用台积电3nm工艺,预计2027年落地,主攻AI推理。

苹果与博通合作开发网络技术,芯片架构将注重时延与吞吐量优化。

关键观点2: 英伟达推出Ne‌motron 3系列开源模型,推理效率显著提升,采用突破性异构混合专家架构。

模型通过先进强化学习技术和大规模并行多环境后训练实现卓越准确率。

关键观点3: 一位网友逆向破解了ChatGPT记忆系统,发现其采用四层架构,通过预生成的轻量级摘要和显式保存的结构化信息实现"记住用户"的效果。

GPT-4最大上下文窗口为128k token,超出后最前面的内容会被遗忘。

关键观点4: 腾讯元宝上线写作模式,支持自动补全剧情人设大纲并一键生成成稿,单次可直出数万字文本。

功能适配多题材创作,支持自定义故事走向与结局。

关键观点5: 通义万相Wan 2.6成为首个支持角色扮演的视频模型,支持音画同步、多镜头生成及声音驱动。

视频生成支持15秒长视频、多镜头叙事和自然音画同步。

关键观点6: 字节跳动发布Seedance 1.5 pro音视频联合生成模型,支持精准音画同步、多语言方言、电影级运镜。

模型采用MMDiT架构实现视听流精准协同,可应用于影视、广告、短剧等场景。

关键观点7: 我国首批L3级自动驾驶车型获得准入许可,长安和北汽的产品分别在指定路段开展上路通行试点。

两家企业已完成并通过产品测试与安全评估。

关键观点8: 谷歌前CEO提出"旧金山共识",认为技术融合到一定阶段会出现AI递归自我改进。

他预测AI数学家将在未来一年内出现推动新数学理论诞生。

关键观点9: 多款AI模型面临视觉推理挑战,面对六指手图像无法正确数出手指数量,暴露出当前AI在视觉推理、因果关系理解上的缺陷。

问题根源在于训练数据中"人手=五指"的强关联和Transformer架构的缺陷。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照