专栏名称: 学姐带你玩AI

这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI！

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

Transformer从菜鸟到新手(七)

学姐带你玩AI · 公众号 · 算法科技媒体 · 2024-06-19 18:09

主要观点总结

本文介绍了如何通过使用束搜索（Beam Search）技术提高BLEU分数，束搜索是一种在生成翻译结果时使用的搜索策略，它能维护多条概率最大的搜索路径，并选择最终的输出。文章还解释了束搜索的工作原理，并通过示例展示了如何使用束搜索和KV缓存来计算BLEU分数，并展示了训练过程以及在测试集上的表现。

关键观点总结

关键观点1: 束搜索介绍

束搜索是一种在生成翻译结果时使用的搜索策略，能维护多条概率最大的搜索路径，并选择最终的输出。

关键观点2: 束搜索工作原理

束搜索通过维护K条概率最大的搜索路径，每次生成时选择概率最大的路径，直到达到结束标记或路径数量达到K。

关键观点3: 束搜索与KV缓存

在训练时使用KV缓存可以提高生成效率，并在生成时通过批量内束搜索实现解码。

关键观点4: 训练与测试表现

在训练过程中，通过计算BLEU分数来评估模型的性能，并在测试集上测试模型的表现。

关键观点5: 注意力机制与掩码

在推理时，需要关注注意力机制的使用和掩码的作用，确保模型生成正确的输出。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

极客公园 · DeepSeek-V4-Pro API 永久降价；iPhone 17 系列中国激活 3000 万；五角大楼再曝外星人文件｜极客早知道

21 小时前

虎嗅APP · AI先抢走的，是年轻人的第一份工作？

昨天

创业邦 · 一副怎样的XR眼镜，才能让用户每天都想打开？

昨天

IT之家 · 【联想 IdeaPad Slim 3i 17IWC11 笔记本发-20260522081833

昨天

IT之家 · 【壹号本全新 OnexPlayer X1 Pro 掌机发布：锐龙-20260522084101

昨天

万能的大熊 · 刚才看一哥们感慨京东掉队的视频，说的比较朴素，觉得是员工懈怠了，-20240624185359

1 年前

中国电信 · 【中奖通知】送1000元话费！

1 年前

丁香医生 · 不骗你！会哄自己开心的人，都掌握了 1 个小技巧

1 年前

天津市应急管理局 · 全民安全公开课——全国10省级地区6小时大直播活动

1 年前

奇物论 · Angew：H2S供体功能化分子机器用于对抗耐多药细菌感染的慢性伤口

11 月前