链路追踪的 “第三种玩法”
Cloud Native
链路分析 K.O “五大经典问题“
Cloud Native
通过链路分析按 IP 分组统计链路数据,快速了解调用请求分布在哪些机器上,特别是问题发生前后的流量分布变化,如果大量请求突然集中在一台或少量机器,很可能是流量不均导致的热点问题。再结合问题发生点的变更事件,快速定位造成故障的错误变更,及时回滚。
链路分析的约束条件
Cloud Native
链路分析为 APM 插上
“自由的翅膀”
Cloud Native
2. 【单机故障】网卡损坏/CPU 超卖/磁盘打满等单机故障,导致部分请求失败或超时,如何排查?
3. 【慢接口治理】新应用上线或大促前性能优化,如何快速梳理慢接口列表,解决性能瓶颈?
4. 【业务流量统计】如何分析重保客户/渠道的流量变化和服务质量?
5. 【灰度发布监控】500台机器分10批发布,如何在第一批灰度发布后,就能快速判断是否有异常?