问题描述
在 Ceph 集群建设完毕后,需要对集群的性能进行测试,获取相应的测试指标(以确定集群是否能够满足性能要求),并针对测试指标对 Ceph 集群进行调优(以尽量减少软件层面带来的性能损耗,尽可能大地发挥硬件的性能优势,达到预期的性能要求)。
虽然,经过多年的研究,在 Linux 操作系统和 Ceph 自身性能上进行了优化。但是,每套 Ceph 集群的规模及场景都有差别,很难给出万能的参数让性能达到预期。要综合考虑各方面因素进行调优,避免参数之间相互影响,而无法获得良好的整体性能。
该笔记将记录:概述 Ceph Cluster 进行基准测试的方法;概述性能调优的方法;针对特定性能场景的解决办法;
解决方案
需要关注的对象
性能调优是为 Ceph 集群定制一个或多个系统的过程,以便使 Ceph 具有最佳的响应时间或吞吐量。
衡量 Ceph 集群的性能有 3 个指标:
1)延迟(Latency):
2)每秒读写次数(IOPS):
3)吞吐量(Latency):我们还可以测量从客户端到服务器网络甚至整个系统的吞吐量;
需要得到的结果
降低 Latency;提高 IOPS;提高 Bandwidth;
提升性能的方法
性能提升需要从两方面入手:
1)性能测试:针对硬件及当前系统进行测试,以了解最大性能;
2)性能调优:根据硬件负载模型、性能表现,来调整参数;