专栏名称: 美团技术团队

10000+工程师，如何支撑中国领先的生活服务电子商务平台？数亿消费者、数百万商户、2000多个行业、几千亿交易额背后是哪些技术在支撑？这里是美团、大众点评、美团外卖、美团配送、美团优选等技术团队的对外窗口。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

LongCat-Flash：如何使用SGLang部署美团Agentic模型

美团技术团队 · 公众号 · 架构 · 2025-09-11 19:58

主要观点总结

本文介绍了美团开源的LongCat-Flash-Chat模型，该模型采用了创新性混合专家模型（Mixture-of-Experts, MoE）架构，实现了计算效率与性能的双重优化。文章详细描述了模型的关键技术，包括与SGLang团队的合作、模型-系统协同设计的重要性、解决方案如SGLang、PD分离、SBO调度、大规模专家并行部署等，以及其他优化措施。文章还介绍了模型性能表现和使用SGLang部署的方法，并提供了推荐阅读资源。

关键观点总结

关键观点1: LongCat-Flash-Chat模型简介

美团开源的LongCat-Flash-Chat模型，采用创新性混合专家模型架构，优化计算效率和性能。

关键观点2: 模型-系统协同设计的重要性

为了解决Prefill和Decode的问题，设计了零专家机制和Shortcut-connected MoE结构，减少计算量并实现结构上的计算-通信重叠。

关键观点3: SGLang团队的合作

结合SGLang框架进行优化，实现模型的高效推理。

关键观点4: 解决方案的详细介绍

包括PD分离架构、SBO调度、大规模专家并行部署等技术的详细解释和实施方式。

关键观点5: 模型性能表现

基于以上优化，LongCat-Flash可以取得显著优于同尺寸模型甚至更小尺寸模型的性能表现。

关键观点6: 使用SGLang部署的方法

提供使用SGLang部署LongCat-Flash的步骤和配置信息。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

高可用架构 · 从 Spec 到损失函数：真正会用 AI Agent 的人，已经在设计循环

昨天

美团技术团队 · 报名｜ACL'26 论文分享会：美团履约团队前沿技术专场

昨天

架构师之路 · OPC产品出来了，决定我人生高度的9项底层能力（一期：人生目标感）

昨天

字节跳动技术团队 · 三篇论文入选 SIGMOD 2026：从真实业务深处长出的字节跳动数据库创新

昨天

仓都加满 · 火锅店老板吐槽：怎么大家都不消费了？

2 年前

北京吃货小分队 · 夏天必囤甜品，实现雪糕自由了！

1 年前

医美行业观察 · 医美日报 | 华熙生物夸迪抖音单场GMV破7200万元；敷尔佳拟注销全资子公司北星药业

1 年前

模玩熊 · 卡普空系列上新！猎人们、格斗家们、逆转裁判迷们——集合！

1 年前

新法治报 · 棠阴 | 赤雨逢赭亭

1 年前