keyfil/方案/20250224-APM平台调研.md
liuxiaohua 903238e851
All checks were successful
Publish to Confluence / confluence (push) Successful in 45s
[2025-02-25] 添加学习平台接入指南
2025-02-25 16:44:28 +08:00

787 B
Raw Permalink Blame History

参考

数据采集:组合使用了各种 agent 和 exporter比如使用 Categraf辅以各类 Exporter 存储:时序库主要使用 VictoriaMetrics因为 VictoriaMetrics 兼容 Prometheus而且性能更好且有集群版本对大部分公司单机版就足够用了 告警引擎:使用夜莺,方便不同的团队管理协作,内置了一些规则开箱即用,告警规则的配置比较灵活 看图可视化:使用 Grafana图表更为炫酷社区非常庞大从 Grafana 站点可以找到很多别人做好的仪表盘,直接导入即可 告警事件 OnCall 分发:使用 FlashDuty聚合了 Zabbix、Prometheus、夜莺、Open-Falcon、云监控、Elastalert 等各类告警事件,统一聚合降噪、排班、认领升级等。