Skip to content

基准及稳定性测试

SonmiHPC集成了一套基准测试稳定性测试套件。该套件要求使用非root用户进行测试,因此在进行相关测试之前,请切换到非root用户。

该测试套件主要用于生成以下程序的测试文件:

  • HPCC
  • FIO
  • OpenFoam
  • LAMMPS
  • VASP
  • STRESS

用户通过以下命令可以查看该测试套件的使用方法。

[sonmi@sonmi ~]$ sonmi-run-test-suite 
sonmihpc benchmark and stability test suite.
Usage:
    sonmi-run-test-suite [command] [option] [item]
Available Commands:
    submit    Submit the benchmark and stability jobs
    select    Select the nodes to run the test
    clean     Clean the jobs' output files
    result    Show the benchmark result
Available submit options:
    benchmark [item]
    stability [item]
Available test items:
    hpcc      benchmark
    fio       benchmark
    openfoam  benchmark
    lammps    benchmark/stability
    vasp      benchmark/stability
    stree     stability
[sonmi@sonmi ~]$ sonmi-run-test-suite 
sonmihpc benchmark and stability test suite.
Usage:
    sonmi-run-test-suite [command] [option] [item]
Available Commands:
    submit    Submit the benchmark and stability jobs
    select    Select the nodes to run the test
    clean     Clean the jobs' output files
    result    Show the benchmark result
Available submit options:
    benchmark [item]
    stability [item]
Available test items:
    hpcc      benchmark
    fio       benchmark
    openfoam  benchmark
    lammps    benchmark/stability
    vasp      benchmark/stability
    stree     stability

选择节点

用户可以通过sonmi-run-test-suite select <nodes>来选择要进行测试的节点,默认为sonmi节点,下面以测试compute-0-0节点为例子。

[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0

要测试多个节点也可以用如下的命令实现,select子命令后的参数格式与slurm的一致。

[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi

基准测试

目前基准测试主要包含了如下测试模块:

  • HPCC
  • FIO
  • OpenFoam
  • LAMMPS
  • VASP

即可以针对以上的单个模块进行测试,也可以对所有模块进行测试。

HPCC测试

运行HPCC测试之前需要修改以下的几个参数:

  • Ns

  • NBs

  • Ps

  • Qs

其中Ps*Qs=系统核数,这两个值通常取偶数,并且Ps <= Qs

NBs为块大小,是将问题规模划分为块的基本单元,针对V2 CPU设置为256,V3、V4 CPU设置为192,V5 CPU设置为384。

Ns为Linkpack测试问题的规模大小,其值通常更集群中的内存大小相关,可以通过以下的公式进行计算。其中nodes为要测试的节点数量,memory为所有节点的内存空间, 以GB为单位。

benchmark-and-stability-1
[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800        Ns
... ...
256          NBs
... ...
2            Ps
4            Qs
... ...
[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800        Ns
... ...
256          NBs
... ...
2            Ps
4            Qs
... ...

修改完以上的参数之后就可以通过以下的命令提交测试。

sonmi-run-test-suite submit benchmark hpcc
sonmi-run-test-suite submit benchmark hpcc

测试完成后可以通过以下命令查看测试结果:

sonmi-run-test-suite result hpcc
sonmi-run-test-suite result hpcc

FIO测试

FIO主要用于对当前用户HOME目录所在的文件系统性能进行测试。用户可以通过以下命令进行测试:

sonmi-run-test-suite submit benchmark fio
sonmi-run-test-suite submit benchmark fio

测试完成后可以通过以下的命令查看测试结果:

sonmi-run-test-suite result fio
sonmi-run-test-suite result fio

OpenFoam测试

该模块主要测试OpenFoam的基准测试。用户可以通过以下的命令进行测试:

sonmi-run-test-suite submit benchmark openfoam
sonmi-run-test-suite submit benchmark openfoam

测试完成后可以通过以下的命令查看测试结果:

sonmi-run-test-suite result openfoam
sonmi-run-test-suite result openfoam

LAMMPS测试

该模块主要用于测试分子动力学程序LAMMPS的基准测试。用户可以通过以下的命令进行测试:

sonmi-run-test-suite submit benchmark lammps
sonmi-run-test-suite submit benchmark lammps

测试完成后可以通过以下的命令查看测试结果:

sonmi-run-test-suite result lammps
sonmi-run-test-suite result lammps

VASP测试

该模块主要用于测试第一性原理计算程序VASP的基准测试。用户可以通过以下的命令进行测试:

sonmi-run-test-suite submit benchmark vasp
sonmi-run-test-suite submit benchmark vasp

测试完成后可以通过以下的命令查看测试结果:

sonmi-run-test-suite result vasp
sonmi-run-test-suite result vasp

提交所有基准测试

用户在修改完HPCC测试的输入文件之后,也可以通过以下的命令来一次性提交所有的基准测试:

sonmi-run-test-suite submmit benchmark
sonmi-run-test-suite submmit benchmark

测试完成之后用户可以通过以下的命令来查看所有的基准测试结果:

sonmi-run-test-suite result
sonmi-run-test-suite result

稳定性测试

目前的稳定性测试主要由以下的3个模块:

  • LAMMPS
  • VASP
  • STRESS

每个模块的测试时间为2小时,总共6小时。在整个测试过程中查看CPU温度情况,以及根据是否发生宕机行为来评估集群的稳定性。

用户可以通过以下的命令来提交稳定性测试:

sonmi-run-test-suite submit
sonmi-run-test-suite submit

清空测试

当用户测试完成后,若要重新进行测试,可以先清除原先残留的测试文件:

sonmi-run-test-suite clean
sonmi-run-test-suite clean

本站内容未经授权禁止转载
联系邮箱: [email protected]