专栏名称: 美团技术团队
10000+工程师,如何支撑中国领先的生活服务电子商务平台?数亿消费者、数百万商户、2000多个行业、几千亿交易额背后是哪些技术在支撑?这里是美团、大众点评、美团外卖、美团配送、美团优选等技术团队的对外窗口。
目录
今天看啥  ›  专栏  ›  美团技术团队

Spark向量化计算在美团生产环境的实践

美团技术团队  · 公众号  · 架构  · 2024-06-20 19:58
    

主要观点总结

美团在Apache Spark上应用了向量化计算技术,通过Gluten+Velox解决方案,在不升级硬件的情况下实现了资源节省和加速作业执行。文章详细介绍了向量化计算的概念、必要性、在美团的实施过程、遇到的挑战、上线效果和未来规划。

关键观点总结

关键观点1: 向量化计算的概念与必要性

向量化计算是一种通过单指令并行处理数据的技术,可成倍提升单核计算能力。在Spark上应用向量化计算,可以在不升级硬件的情况下获得资源节省和加速作业执行。

关键观点2: 在美团的实施过程

美团通过五个阶段实施Spark向量化计算,包括软硬件适配、稳定性验证、性能收益验证、一致性验证和灰度上线。

关键观点3: 遇到的挑战与解决方案

美团在Spark向量化计算中遇到了一些挑战,如稳定性问题、支持ORC并优化读写性能、Native HDFS客户端优化、Shuffle重构和适配HBO等,并通过相应的策略解决了这些问题。

关键观点4: 上线效果与未来规划

上线后,平均内存资源节省40%+,平均执行时间减少13%。计划让绝大部分的SQL任务运行在向量化引擎上,并提升向量化覆盖率和跟进开源社区。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照