「技術情報」カテゴリーアーカイブ

Xeon X3430 + Intel 3420 + DDR3-1333 性能評価（姫野ベンチ）

MB: Supermicro X8SIE-F
Chipset: Intel 3420
CPU: Xeon X3430
MEM: 4GB (DDR3-1333 2GB x 2)

MPI: openMPI
Compiler: gcc 3.4.6
Benchmark: himenoBMTxp
Size: L

1CPU 4core: 3089MFLOPS

Infiniband の優位性

InfinibandがEthernetと比べてパフォーマンス向上には大変有利であることは以前の検証結果からも言えることです。
今回は、ホスト数が増えた場合にどの程度のシステムプロセス値の差が出るかを検証することにしました。

Intel Core i7は、Quad CoreですがIntel Hyper-Threading TechnologyによりOS上からは倍のCPUが認識できます。
今回のテストでは、分割数を多くすることでネットワーク負荷を高くすることを目的とするために、Intel Hyper-Threading Technologyで認識された論理CPUにもジョブを配分することにしました。

■テスト環境
計算ノード 10台
MB: Supermicro X8STi
Chipset: INTEL X58
CPU: Intel Core i7 920
MEM: 12GB (2GB DDR3-1066 x 6)

インターコネクト
1000Base: オンボード (Intel 82574L)
Infiniband: Mellanox MHGS18-XTC (DDR)

ベンチマーク
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: XL

■テスト方法
N=80で姫野ベンチを実行し、投入ホストにてtopコマンドでシステムプロセス値を比較

■結果
1000Base: 23-25%程度

Infiniband: 0-0.3%程度

評価
1000Base Ethernetでは、おおよそ23%のCPUリソースがシステムプロセスとして消費してしまう。
特に多計算ノードによるMPIな流体計算では、このCPUリソースを計算に使えることができるinfinibandを選択することは必須と感じた。

Core i7 860 + Intel 3420 + DDR3-1333 性能評価（姫野ベンチ）

MB: Supermicro X8SIE-F
Chipset: Intel 3420
CPU: Core i7 860
MEM: 8GB (DDR3-1333 2GB x 4)

MPI: openMPI
Compiler: gcc 3.4.6
Benchmark: himenoBMTxp
Size: L

1CPU 4core: 5131MFLOPS

Xeon W5590 + Intel 5520 + DDR3-1333 ECC Reg 性能評価（姫野ベンチ）

MB: Supermicro X8DAi
Chipset: Intel 5520
CPU: Xeon W5590
MEM: 12GB (DDR3-1333 2GB ECC Reg x 6)

MPI: openMPI
Compiler: gfortran 4.1.2
Benchmark: himenoBMTxp
Size:L

結果
2CPU 8node: 14820MFLOPS

Ethernet と Infiniband 性能比較

■テスト環境
計算ノード 2台
MB: TYAN Toledo i3210W
Chipset: INTEL 3200
CPU: Intel Core2Quad Q9450
MEM: 4GB (DDR2-800 2GB x 2)

インターコネクト
100Base: Intel EtherExpress Pro/100 S Desktop Adapter
1000Base: オンボード (Intel 82573)
Infiniband: Mellanox MHGS18-XTC (DDR)

ベンチマーク
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L

■テスト方法
N=8で姫野ベンチを実行し、投入ホストにてtopコマンドでシステムプロセス値を比較

■結果
100Base: 13-16%程度

1000Base: 4-5%程度