专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

不靠海量数据，如何精准喂养大模型？上交Data Whisperer：免训练数据选择法，10%数据逼近...

机器之心 · 公众号 · AI · 2025-07-29 14:38

主要观点总结

本文介绍了由上海交通大学博士生王少博与团队提出的数据选择方法——Data Whisperer。该方法是一种免训练、基于注意力驱动的数据选择框架，可直接利用预训练模型的上下文学习能力，无需额外微调打分模型，仅使用10%的数据就能让微调效果逼近全量数据。论文详细阐述了Data Whisperer的机制，包括其方法原理、与传统数据选择方法的对比以及取得的成效等。

关键观点总结

关键观点1: Data Whisperer的核心思想

Data Whisperer是一种免训练的数据子集选择方法，利用预训练模型自身的上下文学习能力进行打分筛选数据。

关键观点2: Data Whisperer的优势

与传统数据选择方法相比，Data Whisperer无需训练打分模型，节省时间和计算成本。此外，它的随机采样方法以及引入注意力感知权重使得选择过程更为高效和准确。

关键观点3: Data Whisperer的方法机制

Data Whisperer采用上下文学习（ICL）的方式构建示范样本和查询样本的提示，让模型尝试回答查询任务并根据回答质量进行打分筛选数据。

关键观点4: Data Whisperer的应用效果

Data Whisperer在多个任务中取得了显著的提升效果，特别是在资源受限的场景下的精调任务表现出更高的效率和性能。

关键观点5: 未来研究方向

未来可以探索将Data Whisperer迁移到更复杂的任务上，并引入人类反馈和语言理解偏好以增强任务对齐能力。此外，可以结合prompt工程来控制示例顺序以提高效果。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · [CL] On The Role of Pretrained L-20250803062258

9 小时前

量子位 · AI Coding如何重构开发，模型×IDE×Agent深度对话｜量子位AI沙龙

昨天

黄建同学 · 新的多智能体Agent：Eigent （来自OWL团队）Eige-20250801120208

2 天前

爱可可-爱生活 · 构建MCP AI Agent的12大框架精选，助力多智能体协作开-20250801110707

2 天前

数字生命卡兹克 · 还是有蛮多人问我最常用的一些AI产品是啥。8月第1天，想了想，干脆发个合集得了（无任何广）。这些产品，几乎都是我每天都在用的东西，对，几乎每天。坦诚的讲，我用的大部分都是海外版的产品，因为....

2 天前

国际电子商情 · 2024年前5月深圳集成电路进口额增长21.1%

1 年前

国机工程集团 · 核电水工新突破！中海总局中标中广核宁德二期重件码头工程

11 月前

财报小烽 · 财报解读｜川发龙蟒近五年财报解读（19-23）

9 月前

远川研究所 · 再忍一下，愚蠢的智能客服就要消失了

8 月前

安泰职发 · 招聘资讯 | 财信人寿2025校园招聘

7 月前