专栏名称: 极市平台

极市平台是由深圳极视角推出的专业的视觉算法开发与分发平台，为视觉开发者提供多领域实景训练数据库等开发工具和规模化销售渠道。本公众号将会分享视觉相关的技术资讯，行业动态，在线分享信息，线下活动等。网站: http://cvmart.net/

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

Inf-CL: 把 Contrastive Loss 的 Batch Size 冲到100M!

极市平台 · 公众号 · 科技自媒体 · 2024-11-24 22:00

主要观点总结

本文介绍了一种新的Contrastive Loss实现方式——Inf-CL，它通过分块计算策略，在单台A800机器上将batch size扩展到4M，几乎实现了Contrastive Loss batch size的无限扩展，突破了以往认为增加batch size会导致显存不足的限制。文章详细描述了Inf-CL的方法原理、实验结果的对比，包括显存节省度、速度和精度。

关键观点总结

关键观点1: 对比学习的重要性和限制

对比学习在多个领域如图文检索、图像自监督学习、文本检索中占据重要地位。但增大batch size或负样本会导致GPU显存爆炸，成为该领域的一个难题。

关键观点2: Inf-CL方法介绍

Inf-CL采用分块计算策略，通过减少显存占用实现大batch size的对比损失计算。包括前向传播和反向传播的过程以及Multi-Level Tiling策略。

关键观点3: 实验结果

实验结果显示，Inf-CL在降低显存占用的同时，只引入了极少的时间开销。并且在降低显存占用后，仍然保持了较高的训练速度和精度。

关键观点4: 相关工作与灵感来源

介绍了与本文相关的工作，如Gradient Cache、Flash Attention和Ring Attention等，这些工作为Inf-CL的灵感来源。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

酷玩实验室 · 这个男人，用AI拿捏了1000万女性的深夜需求

21 小时前

sven_shi · 这种新闻有很多种写法。站在女方角度就是男方要先生孩子再领证，换到-20260513172141

2 天前

王建硕 · 『AI 自动生成』标签我以前见过

2 天前

BioArtMED · Nat Commun丨吴昊星团队证明构建生物正交可激活前药一体化方法的肿瘤治疗效果

1 年前

代码随想录 · 手撕RPC，突击一波！

1 年前

马后炮化工 · 十六个经典案例，带你快速入门流体动力学 CFD 模拟！干货嘎嘎输出

1 年前

大道无形我有型 · 我认真想了想，不是很确定是不是合适，毕竟这是在明确告诉你家小朋友-20241111113721

1 年前

新重庆-重庆日报 · 首发！重庆—阿富汗中亚班列开行

1 年前