专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微博RSS订阅方法

即刻RSS订阅方法

腾讯研究院AI速递 20250710

腾讯研究院 · 公众号 · 科技媒体 · 2025-07-10 00:01

主要观点总结

该文章介绍了多个关于AI领域的最新进展和相关信息，包括升级后的Veo 3系统，新功能特点，开源模型等的关键信息及其功能介绍等。本文根据文章抽取了几个关键点：新版升级、多模态模型、视频制作工具、端侧多模态模型、AI系统突破等。

Veo 3升级支持仅用一张图片即可生成音频和视频，人物在多镜头下保持高度一致性。用户实测显示人物表情自然、表演到位，被认为是AI叙事领域的重大突破。

Hugging Face开源的SmolLM模型采用双模式系统，支持在深度思考和非思考模式间灵活切换。模型性能超越Llama-3.2-3B和Qwen2.5-3B，支持大上下文窗口功能。

昆仑万维开源的Skywork-R1V 3.0多模态模型在物理推理、逻辑推理和数学解题方面表现突出，超越部分闭源模型。该模型通过强化学习策略GRPO和关键熵驱动机制实现高性能。

Vidu Q1多参考生视频功能可实现角色一致性强的视频生成。同时，vivo发布了端侧多模态模型BlueLM-2.5-3B，支持GUI界面理解并在多项评测中表现优异。

上海交大联合深势科技团队开发的X-Masters系统基于DeepSeek-R1模型构建了工具增强推理智能体X-Master，能在内部推理和外部工具使用间流畅切换。该方案在HLE上首次突破30分并完全开源。

报告指出，在2025年上半年，Gemini系列模型在大模型API市场中占据领先地位。同时，细分领域的竞争格局也呈现差异化，如编程、翻译和营销领域有各自领先模型。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博