「PVE」- 组件 | 原理

参考 Proxmox VE/Service daemons 文档,以了解架构的相关信息。

[Sol] … proxy detected vanished client connection …

Proxy detected vanished client connection – Proxmox error resolved

在界面中,提示 Connection Failure 错误;
查看 pveproxy 日志,提示 proxy detected vanished client connection 错误;

服务重启

systemctl restart corosync
systemctl restart pvedaemon
systemctl restart pvestatd
systemctl restart pve-cluster
systemctl restart pveproxy

[Sol] 某个已删除的节点,仍旧在 Web 界面中显示

问题描述
我们未正确处理节点的 Ceph OSD 便尝试删除节点,导致被删除的节点仍旧显示在 Web 界面中;

解决方案
mv /etc/pve/nodes/<node-name> /tmp

[Sol] 登录失败

[SOLVED] – Proxmox VE – Login failed. Please try again. | Page 3 | Proxmox Support Forum
[Proxmox VE] 修復 cluster 發生的 no quorum 錯誤 | 小信豬的原始部落
Proxmox VE 2.0 Cluster – Proxmox VE

问题描述

用户界面登录失败,登录接口 401 authentication failure 错误,查看日志:

# journalctl -f -u pvedaemon.service
...
Apr 08 03:23:11 pve-01 pvedaemon[1175]: authentication failure; rhost=::ffff:172.31.255.3 user=root@pam msg=cfs-lock 'file-priv_tfa_cfg' error: no quorum!
Apr 08 03:24:08 pve-01 pvedaemon[1173]: authentication failure; rhost=::ffff:172.31.255.3 user=root@pam msg=cfs-lock 'file-priv_tfa_cfg' error: no quorum!
Apr 08 03:25:54 pve-01 pvedaemon[1174]: authentication failure; rhost=::ffff:172.31.255.3 user=root@pam msg=cfs-lock 'file-priv_tfa_cfg' error: no quorum!
Apr 08 03:29:06 pve-01 pvedaemon[1173]: authentication failure; rhost=::ffff:172.31.255.3 user=root@pam msg=cfs-lock 'file-priv_tfa_cfg' error: no quorum!

原因分析

我们的集群存在两个节点,其中一个节点关机,导致选举失败,集群状态异常;

解决方案

将另外节点上线,保证正常选需投票,以使集群出于正常状态;

如果其他节点无法开机,则登录到正常的节点,执行如下命令,减小投票数:

# pvecm expected 1

[Sol] 系统无法启动(KW: error disk lvmid not found)

System unbootable – grub error: disk lvmid not found | Proxmox Support Forum
Boot lvmid issue. Grub rescue | Proxmox Support Forum
[SOLVED] Mengatasi LVM Proxmox Hilang / Tidak Aktif Setelah Upgrade

问题描述:

原因分析:
1)我们没有找到具体原因,只是推测强制断电导致系统故障或 我们平时的操作已破坏系统

解决方案:
1)我们通过 Live CD 启动,然后挂载磁盘,发现磁盘正常;
2)然后我们尝试 GRUB 手动引导,此时系统启动成功;
3)但是此时本地存储无法加载,我们尝试需要解决办法:

# lvchange -an       pve/data
# lvconvert --repair pve/data
# lvchange -ay       pve/data

补充说明:
1)我们依旧未能修复引导的问题;
2)最后的解决办法是:迁移虚拟机示例,然后节点系统重装;

[Sol] Connection error 401: permission denied – invalid PVE ticket

permission denied – invalid PVE ticket (401) | Proxmox Support Forum

问题描述

Web GUI,点击某个节点,提示 Connection error 401: permission denied – invalid PVE ticket 错误;

原因分析

通常是系统时间错误

解决方案

修复系统时间即可;

[Sol] pve error: got lock request timeout

Login failure | Proxmox Support Forum

systemctl stop pve-cluster
rm -f /var/lib/pve-cluster/.pmxcfs.lockfile
systemctl start pve-cluster

[Sol] 多个节点掉线

Cluster not quorate – extending auth key lifetime! | Proxmox Support Forum

问题描述

# 11/28/2023

在 Homelab 中,部署的 PVE Cluster 服务,今天(已很长时间未使用过)我们发现多个节点掉线。

服务 pvedaemon.service 及 pve-cluster.service 出现如下错误:
1)Cluster not quorate – extending auth key lifetime!
2)[status] notice: cpg_send_message retry 40

解决方案

最后,我们通过升级节点(=> 7.4-3)版本,问题得以解决;

[WIP] notice: cpg_send_message retry

[pve-devel] corosync problems – need help