MB: ASUS M4A79T Deluxe
Chipset: AMD 790FX
CPU: PhenomII X4 945
MEM: 4GB (DDR3-1333 2GB x 2)
MPI: openMPI
Compiler: gcc 3.4.6
Benchmark: himenoBMTxp
Size: L
1CPU 4core: 4293MFLOPS
MB: Supermicro X8DTi
Chipset: Intel 5520
CPU: Xeon X5550
MEM: 24GB (DDR3-1333 4GB ECC Reg x 6)
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: XL
結果
2CPU 8node: 13726MFLOPS
2CPU 16node: 13586MFLOPS (HT含む)
評価
HTを使っても落ち込みが少なかった。
HTが多くのアプリケーションに対しパフォーマンス向上になるとは考えにくいが、今回の結果だけで言えば分割数が倍になってもメモリ帯域不足による大きなパフォーマンス劣化になっていないところに注目したい。
計算サーバ 32台
CPU: Core i7 965 Extreme (Quad Core/3.2GHz/8MB/QPI6.4GT)
MB: Supermicro C7X58
MEM: 2GB DDR3-1333 x6 Total 12GB
VGA: ELSA GLADIAC 795GT (512MB GDDR3/PCIe2.0)
NIC: Mellanox MHQH29-XTC (Infiniband 40Gbps QDR/ConnectX)
OS: openSUSE 11.1 x86_64
MPI: openMPI 1.2.8
Compiler: Intel Compiler 11.0
Benchmark: himenoBMTxp
Size: XL
32CPU 128core: 176328MFLOPS