专栏名称: 互联网AI早读课
专注互联网产品、用研、交互、设计、运营领域精选内容。信息爆炸的社会,每天用心的去读一篇文章,也许胜过你的走马观花。每早八点,我们等你。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  互联网AI早读课

AI早知道|美团开源LongCat-Image图像生成模型;腾讯发布混元大模型最新版混元2.0

互联网AI早读课  · 公众号  · 科技媒体  · 2025-12-09 08:03
    

主要观点总结

本文报道了智谱AI、美团、腾讯、火山引擎等公司在人工智能领域的新进展,包括大模型的发布、升级和融资情况。此外,Google也发布了一款新的无代码AI工作流工具。文章还介绍了各模型的应用场景和优势,并给出了行动建议。

关键观点总结

关键观点1: 智谱AI发布GLM-4.6V系列多模态大模型,包括106B和9B版本,支持视觉输入自主调用工具,可处理复杂任务。

该模型将视觉与工具调用能力深度融合,适用于电商、客服或内容审核场景,可实现视觉自动化流程。

关键观点2: 美团发布并开源LongCat-Image图像生成模型,以6B参数实现文生图和图像编辑能力。

该模型采用同源架构与渐进学习,在图像编辑可控性和真实感上表现出色。设计、营销团队可用其快速制作素材,节省成本。

关键观点3: 腾讯发布混元大模型最新版混元2.0,包含Think与Instruct版本,总参数406B,支持复杂推理任务。

该模型具备国际竞争力,适用于科研、金融或复杂文档分析场景,可提高分析精度和效率。

关键观点4: 火山引擎发布豆包语音识别模型2.0,基于Seed混合专家架构,实现深度上下文推理和多模态视觉识别能力。

该模型可应用于会议纪要、客服质检等场景,提升复杂场景下的识别准确率和场景理解能力。

关键观点5: 美国AI法律科技公司Harvey完成1.6亿美元F轮融资,估值达80亿美元。

该公司由前谷歌DeepMind研究员和顶级律所律师创立,专注于“AI+法律”领域。垂直领域“AI+专业服务”获资本高度认可。

关键观点6: Google正式发布Workspace Studio,是基于Gemini 3多模态能力的新一代自动化工具。

该工具无需编码即可快速设计、管理并共享AI智能体,适用于运营、行政、销售等重复性工作较多的部门。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照