Author Archives: admin

swSafeのご紹介

当社ではサーバやワークステーションのバックアップとリストアを簡単な操作で行うためのツールswSafeも販売しています。

このツールにはLinuxがインストールされています。サーバやワークステーションのバックアップもしくはリストアを行いたい時に、サーバやワークステーションへこのツールを取り付けて起動するとLinuxが起動します。
Linuxが起動するので、Linuxで行える様々な操作をサーバやワークステーションに対して行うことが出来ますが、

簡単な操作でバックアップやリストアを行う為
コマンドによる誤操作を防ぐ為

に、専用インターフェイスを開発しました。その画面をここで確認することが出来ます。このインターフェイスにより、

バックアップを行うためのコマンドを覚える必要がなく、
キーボードの十字キーやエンターキーくらい

で、操作出来ます。
更に、このツールはLinux上で動いているので、Linuxが認識出来るデバイス、SATAのみでなく、NVMeにインスールされているOSのバックアップやリストアを行うことが出来ます。(ちなみにNVMeって速くて良いですね。ちょっと発熱が大きいのですが、……。)
このツールの想定している状況は、

OSをクリーンインストール状態へ戻す
定期的なフルバックアップ

です。
最近ではAnsibleなどの構成管理ツールによりOS構成管理を行いやすくなっていますが、構成管理方法を覚えるのに時間が掛かったり、そもそも構成管理ツールがユーザ様の構成に対応していなかったりする場合あります。その場合には、手作業でサーバやワークステーションの設定を行わなければなりません。設定作業の前に、このツールでバックアップを行っておけば、仮に設定が上手く出来なくなってしまっても、作業前の状態に簡単に戻すことが出来ます。このような状況で、このツールが効果を発揮するかもしれません。
swSafeの紹介でした。

Intel Xeon Platinum 8180 (Skylake-SP) Linpackベンチマーク

CPU: Intel Xeon  Platinum 8180 (28core x2CPU)
MEM: DDR4-2400 192GB (16GB x12 枚 )
OS: CentOS 7
■ソフトウェア環境
Intel Compiler: 2018 update3 Cluster Edition
BLAS: Intel MKL
MPI: Intel MPI
■ベンチマーク
HPL 2.2
# プロセスで使うメモリは、おおよそ 32GB 程度に調整
■スコア
Compiler option: mpiicc -Ofast -xCORE-AVX512
Score: 1628.0GFLOPS
■frequency値
AVX512使用時 (28Core動作)
Base frequency: 1.7GHz
Turbo frequency: 2.3GHz
■結果
最大理論性能を以下に示します。
AVX512使用時Turbo frequency = 2.3GHz x 16 演算 x 28core x 2cpu = 2060.8GFLOPS
スコアは 1628.0GFLOPS ですので、理論性能の 79% となりました。
以上

Intel Xeon Silver 4114 (Skylake-SP) Linpckベンチマーク

Skylake-SPがリリースされて以来、ベンチマーク走らせていなかったのでやってみました。
■ハードウェア構成
CPU: Intel Xeon Silver 4114 (10core x2CPU)
MEM: DDR4-2400 128GB (16GB x8 枚 )
OS: CentOS 7
■ベンチマーク
HPL 2.2
# プロセスで使うメモリは、おおよそ 32GB 程度に調整
・環境1
GCC: 8.2.0
BLAS: Atlas 3.10.3
MPI: OpenMPI 3.1.1
・環境2
Intel Compiler: 2018 update3 Cluster Edition
BLAS: Intel MKL
MPI: Intel MPI
■スコア
・環境1
Compiler option: mpicc -Ofast -march=native
Score: 223.2GFLOPS
Core frequency: 2.2GHz
・環境2
Compiler option: mpiicc -Ofast -xCORE-AVX512
Score: 413.6GFLOPS
Core frequency: 1.4GHz
■補足情報
Intel Skylake-SP は並列計算時に、 AVX未使用時 AVX2使用時 AVX512使用時で各々にBase frequencyが決まっています。
そしてTurbo Boostにて、各々のBase frequencyに対しプロセスを動かすコア数ごとに動作周波数が変動します。
・AVX未使用時 [...]

AMD EPYC 7501 + 32GB DDR4-2666 性能評価

1CPU当たり32コアを持つEPYC 7501 x 2個と、32GB DDR4-2666 x 32枚(合計1024GB)を搭載するシステムPOWER MASTER Server S5081にて、姫野ベンチマークによる計測を行ってみました。
ちなみに、AMD EPYCには8coreのダイが4つパッケージに入っていて、各々のダイにはメモリ2chとPCIE x16 2本が接続できる構成となっているとのこと。1CPUでメモリ8chとPCIE x16 8本も持っているのです。
【環境】

CPU:EPYC 7501 x 2個
メインボード:Supermicro H11DSU-iN
メモリ:32GB DDR4-2666 ECC Registered x 32枚(合計1024GB)
OS:CentOS7.3 x86_64
【テスト】
① シングルスレッド評価
Compiler: gcc 7.2.1
Benchmark: himenoBMTxp_l(C, dynamic allocate version)
Size: L
② マルチスレッド評価
MPI: mpich3.2
Compiler: gcc 7.2.1
Benchmark: cc_himenoBMTxp_mpi(C + MPI, static allocate version)
Size: L、XL
【結果】

テスト(SIZE L)
スレッド数
Score(MFLOPS)

シングルスレッド評価
1
5034

マルチスレッド評価(実コアのみ)
64
88590

マルチスレッド評価(SMT有効)
128
71922

テスト(SIZE XL)
スレッド数
Score(MFLOPS)

マルチスレッド評価(実コアのみ)
64
92607

マルチスレッド評価(SMT有効)
128
72877

(SMT: Simultaneous MultiThreading)
Xeon E5-2680v4とEPYC 7501のシングルスレッド値で比較すると、 EPYC 7501は、Xeon E5-2680v4よりも 約1.35倍の高い結果となっています。
並列計算でもスレッド数64で良い結果となっていますが、スレッド数128では値が少し下がっていて、このあたりがメモリ帯域の限界ではなかろうか?
いずれにしても、すでに持っているバイナリ(アプリケーション)で、パフォーマンス向上を目指すならば、AMD [...]

Ryzen 7 1800X + 8GB DDR4-2400 性能評価(姫野ベンチ)

1CPU当たり8コアを持つRyzen 7 1800Xと、8GB DDR4-2400 x 2枚(合計16GB)を搭載するシステムPOWER MASTER A9391にて、姫野ベンチマークによる計測を行ってみました。

【環境】

CPU:Ryzen 7 1800X
メインボード:ASUS PRIME B350M-A
メモリ:8GB DDR4-2400 x 2枚(合計16GB)
OS:CentOS7.3 x86_64
【テスト】
① シングルスレッド評価
Compiler: gcc 4.8.5
Benchmark: himenoBMTxp_l(C, dynamic allocate version)
Size: L
② マルチスレッド評価
MPI: mpich3.2
Compiler: gcc 4.8.5
Benchmark: cc_himenoBMTxp_mpi(C + MPI, static allocate version)
Size: L
【結果】

テスト
スレッド数
Score(MFLOPS)

シングルスレッド評価
1
6229

マルチスレッド評価
8
12913