「PVE」- 日志、监控、告警

监控(Monitoring)

External Metric Server – Proxmox VE

在 PVE 中,针对监控解决方案:
1)官方:其并未提供直接的监控方案,但其支持将自身指标主动写入 InfluxDB 与 Graphite 数据库;
2)第三方:提供很多开源的解决方案,诸如 prometheus-pve-exporter 支持抓取 PVE Cluster 指标;

我们已知的解决方案:

节点监控、虚拟机监控:pve-exporter + Prometheus + Grafana(废弃)

pve-exporter + Prometheus + Grafana

# 01/13/2023 早期我们使用该方案进行监控,但是现在我们决定更换方案。

原因如下:

1)目前(prometheus-pve-exporter 2.0.1)该方案无法抓取 Disk Usage 指标;

2)该监控方案为开源项目,我们认为(并未实际对比)官方方案会更好(或未来会发展更好);

节点监控、虚拟机监控:PVE Metirc Server + InfluxDB + Grafana

PVE Metirc Server + InfluxDB + Grafana

Telegraf + InfluxDB

Telegraf + InfluxDB

Zabbix + Proxmox

Proxmox monitoring and integration with Zabbix

监控 Ceph 集群

Prometheus Module:
1)https://docs.ceph.com/en/latest/mgr/prometheus/#

Prometheus:

Grafana Dashboard:
1)https://grafana.com/grafana/dashboards/2842-ceph-cluster/
2)https://grafana.com/grafana/dashboards/5342-ceph-pools/
3)https://grafana.com/grafana/dashboards/5336-ceph-osd-single/