Skip to content

网络规划

网络类别

高性能计算集群的网络可以根据现实硬件条件进行灵活设置,本教程以目前大多数中小型集群常用的网络规划进行详解。通常来说高性能计算集群的网络可以分为以下几种类别:

  • 存储网络:用于给集群各个节点提供网络存储使用,一般为万兆以太网,支持以太网以及InfiniBand网络;
  • 计算网络:用于集群执行分布式计算任务时,用于各个节点进行通信,支持以太网以及InfiniBand网络;
  • IPMI管理网络:只针对有IPMI功能的硬件,如果集群服务器没有该功能可以忽略。

对于大多数预算不足的场景,存储网络以及计算网络可以选择共用一套网络,对于中小型集群来说可以选用万兆以太网,这样整套集群只需要增加一个万兆交换机;若预算再充足一些可以使用InifiBand网络,需要购置InfiniBand交换机以及配套的网卡。

规划示例

下面以使用万兆以太网作为存储网络以及计算网络共用的网络进行说明。该示例中,使用3台服务器组件一个小型HPC集群,所用到的硬件清单如下:

  • 做为主节点的服务一台,需要配置两个以太网网口,其中一个作为连接外部网络使用,一个作为内部网络使用;
  • 作为计算节点端的服务器2台,至少需要一个以太网网口,作为连接内部网络使用;
  • 万兆以太网交换机一台;
  • 网线若干。

网络的具体拓扑结构如下图所示:

network-1

主节点的两个网口,其中一个网口与外部网络相连接,外部网络可以是上一级的路由器;另一个网口与node0、node1两个计算节点的网口通过万兆以太网交换机连接组成一个内部局域网。

  1. 假如master节点连接外部网络的网口接入192.168.50.0/24的子网中,该网口分配得到的IP为192.168.50.232
  2. 由于master节点在集群的局域网内同时作为dhcp服务器,规划内部子网为10.1.1.0/24的网段,并为master节点内网网口手动分配IP为10.1.1.1
  3. node0与node1通过dhcp服务器自动分配内网ip。

以上为规划的示例小规模集群的网络拓扑结构。

本站内容未经授权禁止转载
联系邮箱: [email protected]