专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
目录
今天看啥  ›  专栏  ›  AI前线

用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度

AI前线  · 公众号  · AI  · 2025-04-18 10:59
    

主要观点总结

谷歌通过Gemini API上线了Gemini 2.5 Flash早期版本,这是其首个完全混合式推理模型。用户可以选择开启'思考'功能并设置'思考预算',以控制模型在思考阶段生成的token数量,达到质量、成本与延迟之间的平衡。输入费用为0.15美元/百万token,输出费用根据是否启用推理有所不同。Gemini 2.5 Flash在某些关键基准测试中表现出色,与竞争对手相比具有缩小性能差距和价格优势,引起企业和网友的关注与讨论。

关键观点总结

关键观点1: Gemini 2.5 Flash的引入

谷歌通过Gemini API在Google AI Studio和Vertex AI预览中上线了Gemini 2.5 Flash早期版本。它是谷歌首个完全混合式推理模型。

关键观点2: “思考”功能和“思考预算”的设置

用户可以根据需求选择是否开启“思考”功能,并设置“思考预算”,以精细控制模型在思考阶段生成的token数量,实现质量、成本与延迟之间的平衡。

关键观点3: 费用结构

Gemini 2.5 Flash的输入费用是0.15美元/百万token,输出费用在关闭推理时为0.60美元/百万 token,启用推理时上升至3.50 美元/百万token。

关键观点4: 性能表现

Gemini 2.5 Flash在多项关键基准测试中表现出色,缩小了与竞争对手的性能差距,并受到企业和网友的关注和好评。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照