2009年10月 のアーカイブ

Ethernet と Infiniband 性能比較

2009年10月21日 水曜日

■テスト環境
計算ノード 2台
MB: TYAN Toledo i3210W
Chipset: INTEL 3200
CPU: Intel Core2Quad Q9450
MEM: 4GB (DDR2-800 2GB x 2)

インターコネクト
100Base: Intel EtherExpress Pro/100 S Desktop Adapter
1000Base: オンボード (Intel 82573)
Infiniband: Mellanox MHGS18-XTC (DDR)

ベンチマーク
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L

■テスト方法
N=8で姫野ベンチを実行し、投入ホストにてtopコマンドでシステムプロセス値を比較

■結果
100Base: 13-16%程度

1000Base: 4-5%程度

Infiniband: 0-0.3%程度

評価
計算ノード2台だけでもこれだけの違いが見られた。
インターコネクトによるパフォーマンス劣化を避けるためにHPC向け高速インターコネクトであるInfiniband選択は大変有効であると再認識をしました。

PhenomII X4 945 + AMD 790FX + DDR3-1333 性能評価(姫野ベンチ)

2009年10月21日 水曜日

MB: ASUS M4A79T Deluxe
Chipset: AMD 790FX
CPU: PhenomII X4 945
MEM: 4GB (DDR3-1333 2GB x 2)

MPI: openMPI
Compiler: gcc 3.4.6
Benchmark: himenoBMTxp
Size: L

1CPU 4core: 4293MFLOPS

Xeon X5550 で Hyper-Threading テクノロジ 評価(姫野ベンチ)

2009年10月21日 水曜日

MB: Supermicro X8DTi
Chipset: Intel 5520
CPU: Xeon X5550
MEM: 24GB (DDR3-1333 4GB ECC Reg x 6)

MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: XL

結果
2CPU 8node: 13726MFLOPS
2CPU 16node: 13586MFLOPS (HT含む)

評価
HTを使っても落ち込みが少なかった。
HTが多くのアプリケーションに対しパフォーマンス向上になるとは考えにくいが、今回の結果だけで言えば分割数が倍になってもメモリ帯域不足による大きなパフォーマンス劣化になっていないところに注目したい。