ARMサーバ販売開始！

最大128コアのAmpere Altra/Altra Maxプロセッサ(ARMv8.2+ベース)対応のフロントI/O、省スペース(奥行:449mm)2Uラックマウントサーバ。

CPUは Ampere Altra Maxシリーズも選択できます。
最もグレードが高いCPUモデル M128-30 は、128コア 3.0GHz TDP 250W となります。
メモリは DDR4-3200 RDIMM対応で最大 4TB まで搭載可能です。
対応OSは現時点では Linux のみとなっています。

以上

Grid Engineについてつづき①

Grid Engineとはクラスタコンピューティングにおけるジョブ管理システムを担うミドルウェアです。

前回の記事

ジョブ管理システムでGPUリソース管理は必須要素となっています。
GPUリソース管理できるジョブ管理システムで一般的にLinux利用できそうなものがあるか？
Slurm がよさそうです。
NVIDIA Management Library (NVML) を介してGPUリソースを管理します。
Slurm GPU Management

では Grid Engine は無理なのか？
制限はありますがそうでもなさそうです。
qconfコマンドでリソース作成しホスト設定でGPUをリソースに割当るようなことをすればできそうです。
次回はそのあたりやってみよう。

つづく

Grid Engineについて

Grid Engineとはクラスタコンピューティングにおけるジョブ管理システムを担うミドルウェアです。
元々はSun Microsystems社によりオープンソース Sun Grid Engineとして公開されていましたが、Oracle社によるSun Microsystems社の買収に伴いOracle Grid Engineとしてリリースされ、翌年にはオープンソース Sun Grid Engine が閉鎖され 6.2update5 で開発は終了しました。
その後 Oracle Grid Engine は Univa社に引き継がれることで Univa Grid Engine となりさらに Altair社に引き継がれ現在はAltair Grid Engineとなっています。

Oracle社によるSun Microsystems社の買収後に Sun Grid Engine 6.2update5をフォークする形で、Open Grid Scheduler と Son of Grid Engine の2つの派生プロジェクトがスタートしました。

Open Grid Scheduler は現在も存在していますが、2011.11p1リリースを最後に更新されていません。
Open Grid Scheduler

Son of Grid Engine はサイト自体が消えています。

また最近気が付きましたが Some Grid Engine という派生プロジェクトがGitで公開されています。
Some Grid Engine

Some Grid Engine は対応OS 多く驚きです。

Arch Linux
Ubuntu Server 22.04
Ubuntu Server 20.04
Void Linux
Alpine Linux
AlmaLinux 9.2
RockyLinux 9.1
AlmaLinux 8.8
CentOS 7.9
openSUSE Leap
openSUSE Tumbleweed

代表的なLinux OSはサポートされています。
ちなみに Ubuntu は、自前リポジトリに gridengineパッケージありますが、かなりゴニョゴニョ設定しないと動作しません。
ですが Some Grid Engine なら簡単にインストールでき普通に使えて快適でした。

つづく

iWARP動作検証つづき④

iWARP (Internet Wide-Area RDMA Protocol) は、TCP/IPネットワーク経由でRDMAを実装するネットワークプロトコルです。

前回の記事

Rocky Linux 9.2でIntel NIC iWARPテストしました。E810チップのNICです。
E810-XXVDA2

OSは普通にインストールします。
次にNIC関連のドライバインストールです。
ice バージョン → 1.11.14
irdma バージョン → 1.11.58
問題なくmakeもできてインストール終わりました。

ここからはRDMAドライバ irdma の設定についてです。
irdmaインストールすると以下ファイルができます。

# cat /etc/modprobe.d/irdma.conf 
blacklist i40iw
alias i40iw irdma

この設定内容ではDualポートなら両ポートともにiWARPになっています。
ここに以下を追加するとろ両ポートともにRoCEになります。

options irdma roce_ena=1

ポート指定することもできる。
以下のようにするとポート0がRocEになります。

options irdma roce_port_cfg=1

iWAPとRoCEを混在することができます。
以下のコマンドで状態確認ができます。

# ibv_devinfo 
hca_id:	irdma0
	transport:			iWARP (1)

hca_id:	irdma1
	transport:			InfiniBand (0)

transport iWARP は iWARPです。
transport Infiniband は RoCEです。

つづく

iWARP動作検証つづき③

iWARP (Internet Wide-Area RDMA Protocol) は、TCP/IPネットワーク経由でRDMAを実装するネットワークプロトコルです。

前回の記事

Intel NICでiWARPテストしています。E810チップのNICです。
E810-XXVDA2

仕様を見るとRDMA対応は以下のようになっています。

IWARP/RDMA はい
RoCEv2/RDMA はい

iWARPだけでなくRoCEにも対応しているようです。
これはテストしみよう！！

前回の記事で書いた
・NICドライバ
・NIC RDMAドライバ
・RDMA Coreライブラリ
は以下です。
NICドライバ → iceドライバ
NIC RDMAドライバ → irdmaドライバ
RDMA Coreライブラリ → rdma-coreパッケージ
rdma-coreパッケージは、OS側リポジトリにも用意されています。

つづく

System Works Blog

Professional Factory Services

ARMサーバ販売開始！

Grid Engineについてつづき①

Grid Engineについて

iWARP動作検証つづき④

iWARP動作検証つづき③