专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

全量指令微调有害！

深度学习自然语言处理 · 公众号 · · 2024-09-25 17:33

主要观点总结

本文介绍了关于指令微调预训练模型的指导意义的文章。文章讨论了使用指令微调数据集对模型进行全量微调可能带来的问题，包括模型无法学习到真正的新知识，并且可能产生模式复制等问题。同时，文章还讨论了LoRA指令微调相较于全量微调的优点。

文章指出，在使用LoRA指令微调时，模型几乎学不到新知识，特别是在模型没有充分预训练的情况下。但在某些限定条件下，比如模型在相关领域上有充分的预训练，LoRA指令微调能够帮助模型更好地利用预训练知识。

全量微调会学习指令微调数据集中的用词和风格，导致模型在测试场景中答非所问或者产生幻觉。文章通过实例说明了这一问题，并指出在使用指令微调数据集时需要考虑模型是否经过充分的预训练。

文章提醒读者，在使用指令微调数据集时需要注意数据集的来源和风格，以及模型是否经过充分的预训练。同时，需要权衡使用全量微调和LoRA指令微调的利弊，根据具体情况选择合适的微调方式。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博