专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
今天看啥  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250425

腾讯研究院  · 公众号  · 科技媒体  · 2025-04-25 00:01
    

主要观点总结

文章介绍了多个关于AI领域的新闻和进展,包括OpenAI的新图像生成模型、微软推出的AI智能体同事功能、多模态模型Skywork-R1V的开源版本、腾讯云的代码助手升级、智能座舱的量产、音频工具MiniMax Audio的发布等。

关键观点总结

关键观点1: OpenAI发布新图像生成模型gpt-image-1及其API,支持图像生成、编辑和变体功能。

该模型支持自定义尺寸、质量、格式、压缩度和背景透明度,能结合世界知识生成高质量图像。多家企业已将该API集成到产品中,应用于多个领域。

关键观点2: 微软推出AI智能体同事功能,包括研究员(Researcher)、分析师(Analyst)等智能体,打造全新工作流程系统。

Microsoft 365 Copilot更新整合了网页、工作内容和Pages,支持全天候专家咨询、新型工作流、综合搜索等功能。微软预测未来所有公司都将转型为前沿公司,由人类和AI智能体组成混合团队。

关键观点3: Skywork-R1V 2.0版本再开源,支持视觉文本双推理,并在多项测试中达到开源SOTA成绩。

新增Skywork-VL Reward模型,提升模型泛化能力。在高考理科题目解答中展现出优异实力,并由多家企业采用,应用于实际场景。

关键观点4: 腾讯云推出Craft软件开发智能体,支持自然语言生成项目,缩短开发平均编码时间。

该智能体采用MCP协议,可接入测试、构建、部署等工作流程,支持第三方插件扩展。已在腾讯内部广泛应用,并服务百万开发者及数千家团队。

关键观点5: 首个纯端侧大模型驱动的智能座舱cpmGO实现量产,刷新行业纪录。

cpmGO具备纯本地运行、毫秒级响应等特点,已获得芯片厂商支持和车企合作。通过MiniCPM技术实现数据本地处理、多模态交互等功能,解决传统云端方案的网络依赖问题。

关键观点6: MiniMax发布AI音频工具MiniMax Audio,支持多种语言,完成高精度声音克隆。

该工具支持直接读取PDF、TXT及网页内容,配备多种预设音色和灵活的声音参数调节。价格亲民,提供基础套餐和API接入等企业级服务。

关键观点7: OpenAI对用户深度研究查询限额进行提升,增加模型使用数量。

OpenAI对Plus、Team、Enterprise和Education用户的深度研究查询限额从每月10次提升至25次。专业用户的使用限额增加到每月250次。

关键观点8: Ostris团队发布文生图扩散模型Flex.2-preview,支持线条、姿态和深度控制等功能。

该模型采用轻量化设计,支持高级图像修补。基于Apache2.0许可开源,支持微调和商业使用,集成XLabs ControlNet,性能优于前代模型。

关键观点9: ManipTrans方法能高效迁移人类双手操作技能至机器人灵巧手。

北京通用人工智能研究院等单位提出ManipTrans方法,采用两阶段模仿和残差学习模块进行精细调整,解决形态差异和交互精度问题。同时发布大规模数据集DexManipNet,并已在真机平台验证可行性。

关键观点10: Mercor AI招聘CEO强调未来有价值的人才特征。

人类数据市场从众包低技能任务转向筛选顶尖人才,评估模型需要测试基本能力和“经济上有价值的工作”表现。未来最有价值的人才特征是拥有“反常识性观点”和“品味”,以及良好的适应性。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照