基准及稳定性测试
SonmiHPC集成了一套基准测试及稳定性测试套件。该套件要求使用非root用户进行测试,因此在进行相关测试之前,请切换到非root用户。
该测试套件主要用于生成以下程序的测试文件:
- HPCC
- FIO
- OpenFoam
- LAMMPS
- VASP
- STRESS
用户通过以下命令可以查看该测试套件的使用方法。
[sonmi@sonmi ~]$ sonmi-run-test-suite
sonmihpc benchmark and stability test suite.
Usage:
sonmi-run-test-suite [command] [option] [item]
Available Commands:
submit Submit the benchmark and stability jobs
select Select the nodes to run the test
clean Clean the jobs' output files
result Show the benchmark result
Available submit options:
benchmark [item]
stability [item]
Available test items:
hpcc benchmark
fio benchmark
openfoam benchmark
lammps benchmark/stability
vasp benchmark/stability
stree stability
[sonmi@sonmi ~]$ sonmi-run-test-suite
sonmihpc benchmark and stability test suite.
Usage:
sonmi-run-test-suite [command] [option] [item]
Available Commands:
submit Submit the benchmark and stability jobs
select Select the nodes to run the test
clean Clean the jobs' output files
result Show the benchmark result
Available submit options:
benchmark [item]
stability [item]
Available test items:
hpcc benchmark
fio benchmark
openfoam benchmark
lammps benchmark/stability
vasp benchmark/stability
stree stability
选择节点
用户可以通过sonmi-run-test-suite select <nodes>
来选择要进行测试的节点,默认为sonmi节点,下面以测试compute-0-0节点为例子。
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0
要测试多个节点也可以用如下的命令实现,select子命令后的参数格式与slurm的一致。
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi
基准测试
目前基准测试主要包含了如下测试模块:
- HPCC
- FIO
- OpenFoam
- LAMMPS
- VASP
即可以针对以上的单个模块进行测试,也可以对所有模块进行测试。
HPCC测试
运行HPCC测试之前需要修改以下的几个参数:
Ns
NBs
Ps
Qs
其中Ps*Qs=系统核数,这两个值通常取偶数,并且Ps <= Qs。
NBs为块大小,是将问题规模划分为块的基本单元,针对V2 CPU设置为256,V3、V4 CPU设置为192,V5 CPU设置为384。
Ns为Linkpack测试问题的规模大小,其值通常更集群中的内存大小相关,可以通过以下的公式进行计算。其中nodes为要测试的节点数量,memory为所有节点的内存空间, 以GB为单位。
[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800 Ns
... ...
256 NBs
... ...
2 Ps
4 Qs
... ...
[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800 Ns
... ...
256 NBs
... ...
2 Ps
4 Qs
... ...
修改完以上的参数之后就可以通过以下的命令提交测试。
sonmi-run-test-suite submit benchmark hpcc
sonmi-run-test-suite submit benchmark hpcc
测试完成后可以通过以下命令查看测试结果:
sonmi-run-test-suite result hpcc
sonmi-run-test-suite result hpcc
FIO测试
FIO主要用于对当前用户HOME目录所在的文件系统性能进行测试。用户可以通过以下命令进行测试:
sonmi-run-test-suite submit benchmark fio
sonmi-run-test-suite submit benchmark fio
测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result fio
sonmi-run-test-suite result fio
OpenFoam测试
该模块主要测试OpenFoam的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark openfoam
sonmi-run-test-suite submit benchmark openfoam
测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result openfoam
sonmi-run-test-suite result openfoam
LAMMPS测试
该模块主要用于测试分子动力学程序LAMMPS的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark lammps
sonmi-run-test-suite submit benchmark lammps
测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result lammps
sonmi-run-test-suite result lammps
VASP测试
该模块主要用于测试第一性原理计算程序VASP的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark vasp
sonmi-run-test-suite submit benchmark vasp
测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result vasp
sonmi-run-test-suite result vasp
提交所有基准测试
用户在修改完HPCC测试的输入文件之后,也可以通过以下的命令来一次性提交所有的基准测试:
sonmi-run-test-suite submmit benchmark
sonmi-run-test-suite submmit benchmark
测试完成之后用户可以通过以下的命令来查看所有的基准测试结果:
sonmi-run-test-suite result
sonmi-run-test-suite result
稳定性测试
目前的稳定性测试主要由以下的3个模块:
- LAMMPS
- VASP
- STRESS
每个模块的测试时间为2小时,总共6小时。在整个测试过程中查看CPU温度情况,以及根据是否发生宕机行为来评估集群的稳定性。
用户可以通过以下的命令来提交稳定性测试:
sonmi-run-test-suite submit
sonmi-run-test-suite submit
清空测试
当用户测试完成后,若要重新进行测试,可以先清除原先残留的测试文件:
sonmi-run-test-suite clean
sonmi-run-test-suite clean