专栏名称: 极市平台
极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台,为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯,行业动态,在线分享信息,线下活动等。 网站: http://cvmart.net/
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  极市平台

Thinking Machines首款产品重大更新:K2 Thinking、Qwen3-VL都可以微...

极市平台  · 公众号  · 互联网短视频 科技自媒体  · 2025-12-16 22:00
    

主要观点总结

Tinker是一款帮助开发者和研究人员微调语言模型的API,无需搭建GPU,兼容OpenAI接口,支持LoRA/DPO/RHLF全流程。最新更新包括支持Kimi K2 Thinking模型的后训练,新增视觉模型Qwen3-VL以及视觉输入功能。这使得普通开发者能够微调大规模模型,如Kimi K2 Thinking,降低了模型训练的门槛。最新的测试显示,经过微调的Qwen3-VL模型在图像分类任务上表现优异。

关键观点总结

关键观点1: Tinker将语言模型的后训练封装成一键API。

开发者无需搭建GPU,即可使用Tinker进行模型微调。Tinker兼容OpenAI接口,支持LoRA/DPO/RHLF全流程。

关键观点2: Tinker支持Kimi K2 Thinking模型的后训练。

这是Thinking Machines推出的首款产品,具有万亿参数规模,专为长链推理和工具调用场景设计。

关键观点3: Tinker新增视觉模型Qwen3-VL和视觉输入功能。

Qwen3-VL支持视觉输入,可以处理图片、截图等视觉内容。这对于图像分类和其他视觉任务非常有用。

关键观点4: 经过微调的Qwen3-VL模型在图像分类任务上表现优异。

与DINOv2相比,在小样本数据场景下,经过微调的Qwen3-VL模型表现出更好的性能。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照