「Ours」- 告警通知 | Alert Message Entry

在告警消息中,必须包含(及应该包含)的数据

告警标题 | title | 告警名称|是否解决|

严重等级 | severity
0 | Emergencies | 服务致命的异常,系统已经无法恢复正常,必须重启服务;
1 | Alert | 服务重大的异常,需要立即采取措施。如内存占用率达到极限等;
2 | Critical | 服务的异常,需要采取措施进行处理或原因分析。如服务内存占用率低于下限阈值和 BFD 探测出服务不可达等;
3 | Error | 错误的操作或服务的异常流程,不会影响后续业务,但是需要关注并分析原因。如用户的错误指令、用户密码错误和检测出错误协议报文等;
4 | Warning | 服务运转的异常点,可能引起业务故障,需要引起注意。如用户关闭路由进程、BFD 探测的一次报文丢失和检测出错误协议报文等;
5 | Notification | 服务正常运转的关键操作信息。如端口 shutdown、邻居发现和协议状态机的正常跳转等;
6 | Informational | 服务正常运转的一般性操作信息。如用户使用 display 命令等;
7 | Debugging | 服务正常运转的一般性信息,用户无需关注;

告警时间(datetime):StartAt – EndAt

集群名称(cluster)

服务位置(service):NAMESPACE/[主机, Pod, …]

详细信息(description):告警消息内容