监控(Metrics)
External Metric Server – Proxmox VE
在 PVE 中,针对监控解决方案:
1)官方的:其并未提供直接的监控方案,但其支持将自身指标主动写入 InfluxDB 与 Graphite 数据库;
2)第三方:提供很多开源的解决方案,诸如 prometheus-pve-exporter 支持抓取 PVE Cluster 指标;
我们已知的解决方案:
[OBS.] 节点监控、虚拟机监控:pve-exporter + Prometheus + Grafana(废弃)
pve-exporter + Prometheus + Grafana
# 01/13/2023 早期我们使用该方案进行监控,但是现在我们决定放弃改方案,而更换其他方案;
更换其他方案的原因如下:
1)目前(prometheus-pve-exporter 2.0.1)该方案无法抓取 Disk Usage 指标;
2)该监控方案为开源项目,我们认为(并未实际对比)官方方案会更好(或未来会发展更好);
1)目前(prometheus-pve-exporter 2.0.1)该方案无法抓取 Disk Usage 指标;
2)该监控方案为开源项目,我们认为(并未实际对比)官方方案会更好(或未来会发展更好);
[REC.] 节点监控、虚拟机监控:PVE Metirc Server + InfluxDB + Grafana(推荐)
PVE Metirc Server + InfluxDB + Grafana
Telegraf + InfluxDB(未测试)
Zabbix + Proxmox(未测试)
Proxmox monitoring and integration with Zabbix
[REC.] 存储监控、监控 Ceph 集群:Ceph Exporter + Node Exporter + Prometheus(推荐)
Prometheus Module(Ceph Exporter):
1)https://docs.ceph.com/en/latest/mgr/prometheus/#
Grafana Dashboard:
1)https://grafana.com/grafana/dashboards/2842-ceph-cluster/
2)https://grafana.com/grafana/dashboards/5342-ceph-pools/
3)https://grafana.com/grafana/dashboards/5336-ceph-osd-single/
日志(Logging)
WIP