专栏名称: 字节跳动技术团队
字节跳动的技术实践分享
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  字节跳动技术团队

观测成本如何优化?APMPlus 尾采样技术的降本增效实践

字节跳动技术团队  · 公众号  · 架构  · 2026-01-16 18:25
    

主要观点总结

本文介绍了分布式链路追踪中的采样技术,并重点介绍了火山引擎APMPlus团队在尾采样方面的技术实践。文章首先描述了困境,即如何在确保R.E.D指标准确性、精准捕获异常链路的同时,有效控制数据采集成本。然后详细阐述了APMPlus团队的设计方案,包括数据处理主流程、尾采样的基础、采样决策机制以及性能与资源优化等方面的内容。最后,通过性能压测验证了尾采样的性能表现,并探讨了尾采样的适用边界和头采样与尾采样的结合使用。

关键观点总结

关键观点1: 尾采样技术提供了一种新的解决思路,能够在确保R.E.D指标准确性的同时,精准捕获异常链路。

尾采样是一种“先收集,后决策”的策略,等待一条Trace上的所有(或绝大部分)Span都生成完毕,然后基于完整的链路信息做出采样决策。

关键观点2: APMPlus团队通过设计多级采样机制,满足了复杂的采样需求,并实现了灵活配置的组合策略。

用户可以通过定义多个采样策略及其优先级和匹配规则,来灵活控制采样行为。此外,组合策略可以包括Span状态采样、耗时采样和概率采样等。

关键观点3: APMPlus团队实施了一系列优化措施,以应对尾采样带来的性能挑战。

这些措施包括决策前置、快速采样、采样结果缓存以及实现决策过程监控等,以确保尾采样的性能表现。

关键观点4: 尾采样的性能表现得到了实测验证,并在实际生产环境中得到了应用。

在受控环境下进行的性能压测表明,尾采样的资源开销可控,并且在高负载场景下表现稳定。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照