这是一组配置 Prometheus + Grafana + Exporters + Alloy(kube-state-metrics) 的监控组件。
使用 shell 脚本配置。
设计:
- 基本组件由 systemd 守护进程统一管理自启动和生命周期。
- gpu_exporter 由于一些库的历史原因,用 docker 管理;
- alloy + kube-state-metrics 由 Helm 统一管理(配置挂载了 ss 进行代理)
将这些组件统一放置在 /opt/monitoring 下,并将改目录及其子文件的权限改为 prometheus:prometheus 的用户和用户组。
文件树如下: