「PVE」- 日志、监控、告警

监控（Metrics）

External Metric Server – Proxmox VE

在 PVE 中，针对监控解决方案：
1）官方的：其并未提供直接的监控方案，但其支持将自身指标主动写入 InfluxDB 与 Graphite 数据库；
2）第三方：提供很多开源的解决方案，诸如 prometheus-pve-exporter 支持抓取 PVE Cluster 指标；

我们已知的解决方案：

[OBS.] 节点监控、虚拟机监控：pve-exporter + Prometheus + Grafana（废弃）

pve-exporter + Prometheus + Grafana

# 01/13/2023 早期我们使用该方案进行监控，但是现在我们决定放弃改方案，而更换其他方案；

更换其他方案的原因如下：

1）目前（prometheus-pve-exporter 2.0.1）该方案无法抓取 Disk Usage 指标；

2）该监控方案为开源项目，我们认为（并未实际对比）官方方案会更好（或未来会发展更好）；

[REC.] 节点监控、虚拟机监控：PVE Metirc Server + InfluxDB + Grafana（推荐）

PVE Metirc Server + InfluxDB + Grafana

Telegraf + InfluxDB（未测试）

Telegraf + InfluxDB

Zabbix + Proxmox（未测试）

Proxmox monitoring and integration with Zabbix

[REC.] 存储监控、监控 Ceph 集群：Ceph Exporter + Node Exporter + Prometheus（推荐）

Prometheus Module（Ceph Exporter）：
1）https://docs.ceph.com/en/latest/mgr/prometheus/#

Grafana Dashboard：
1）https://grafana.com/grafana/dashboards/2842-ceph-cluster/
2）https://grafana.com/grafana/dashboards/5342-ceph-pools/
3）https://grafana.com/grafana/dashboards/5336-ceph-osd-single/

日志（Logging）

WIP