Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L
[TABLE=11]
AMD Opteron 6128 を追加しました。
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L
[TABLE=11]
AMD Opteron 6128 を追加しました。
MB: Supermicro H8QGi+-F
Chipset: AMD SR5690
CPU: Opteron 6128
MEM: 64GB (DDR3-1333 2GB ECC Reg x32)
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L
4CPU 32core: 26802MFLOPS
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: XL
4CPU 32core: 27191MFLOPS
ちなみにメモリモジュール16枚と32枚でパフォーマンスに大きな差はなかった。
Xeon X7550に見られた現象はOpteron 6100シリーズでは見られないようだ。
MB: Supermicro X8QB6-F
Chipset: Intel 7500
CPU: Xeon X7550
MEM: 64GB (DDR3-1333 2GB ECC Reg x32)
MPI: openMPI
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: XL
4CPU 32core: 36550MFLOPS
ちなみに
MEM: 32GB (DDR3-1333 2GB ECC Reg x16)
4CPU 24core: 24182MFLOPS
4CPU 32core: 25171MFLOPS
でした。
メモリモジュール16枚では、分割数が16と32でパフォーマンスに大きな差がない。
メモリモジュール1枚あたりの容量を少なくしても全スロットにメモリを搭載する構成が良いと思われる。
Compiler: gcc 4.1.2
Benchmark: himenoBMTxp
Size: L
[TABLE=10]
Intel Xeon X5680 と Intel Xeon X7550 を追加しました。