液体と浸漬はスーパーコンピューティング '22 の新しいクールです • The Register

ブログ

ホームページホームページ / ブログ / 液体と浸漬はスーパーコンピューティング '22 の新しいクールです • The Register

Jun 11, 2023

液体と浸漬はスーパーコンピューティング '22 の新しいクールです • The Register

SC22 今週ダラスで開催されたスーパーコンピューティング カンファレンスでは、液体冷却がホットな話題になったと言っても過言ではありません。 展示会場は見渡す限り水冷サーバーで埋め尽くされており、

SC22 今週ダラスで開催されたスーパーコンピューティング カンファレンスでは、液体冷却がホットな話題になったと言っても過言ではありません。

見渡す限り、展示ホールには液冷サーバー、油を満たした浸漬冷却タンク、データセンターにテクノロジーを導入するために必要なすべての付属品、ポンプ、冷却剤分配ユニット (CDU) が詰め込まれていました。 。

これがハイパフォーマンス コンピューティングに関するカンファレンスであることを考えると、熱管理に重点が置かれていることは驚くべきことではありません。 しかし、現在 400W CPU と 700W GPU が世に出回っているため、これは HPC や AI に限った問題ではありません。 AI/ML 対応システムをデータセンターに追加しようとする企業が増えているため、3kW、5kW、さらには 10kW のシステムもそれほど奇抜なものではなくなりました。

そこで、今年のショーで注目を集めた水冷キットの内訳を紹介します。

SC22 で披露される液冷システムの大部分は直接液冷システムです。 これらは、銅またはアルミニウムのヒートシンクとファンをコールド プレート、ゴム チューブ、継手に交換します。

正直に言うと、これらのコールドプレートはどれも多かれ少なかれ同じに見えます。 これらは本質的には、流体が通過するための入口と出口を備えた中空の金属ブロックにすぎません。 ここで「流体」という言葉を使用していることに注意してください。液冷システムでは、必ずしも水である必要はない任意の数の冷却剤を使用できるからです。

CoolITコールドプレートを搭載したSupermicroの水冷サーバー。 - 拡大するにはクリックしてください

多くの場合、OEM は同じベンダーからコールド プレートを調達しています。 たとえば、CoolIT は、HPE や Supermicro を含むいくつかの OEM に液冷ハードウェアを提供しています。

ただし、差別化の機会がないわけではありません。 これらのコールド プレートの内側にはマイクロ フィン アレイが充填されており、これらを微調整して流体の流れを最適化できます。 冷却するダイの大きさや数に応じて、これらのコールド プレートの内部はかなり変化する可能性があります。

展示会場で見た水冷システムのほとんどは、コールドプレートを接続するためにある種のゴムチューブを使用していました。 これは、液体が CPU や GPU などの特定のコンポーネントのみを冷却していることを意味します。 したがって、ファンの大部分は取り外すことができますが、ある程度の空気の流れは依然として必要です。

HPE は、AMD の 96 コア Epyc 4 CPU を使用した最新の水冷 Cray EX ブレードをデモします。 - 拡大するにはクリックしてください

Lenovo の Neptune と HPE Cray の EX ブレードは、この規則の例外でした。 彼らのシステムは液体冷却専用に構築されており、銅チューブ、分配ブロック、CPU、GPU、メモリ、NIC を含むすべてのコールド プレートがぎっしり詰め込まれています。

このアプローチを使用して、HPE は AMD の 400W Epyc 4 Genoa CPU を 8 個 19 インチ シャーシに詰め込むことに成功しました。

デュアル AMD Genoa CPU と 4 つの Nvidia H100 GPU で構成された水冷 Lenovo Neptune サーバー。 - 拡大するにはクリックしてください

一方、Lenovo は、96 コア Epyc のペアと Nvidia の H100 SXM GPU の 4 つを冷却するように設計された 1U Neptune システムを披露しました。 実装に応じて、メーカーは、自社の直接液冷システムがサーバーによって生成される熱の 80 パーセントから 97 パーセントを除去できると主張しています。

SC22 で展示された、より珍しい液体冷却技術の 1 つは浸漬冷却でした。これは過去数年で再び流行しています。 これらのシステムは、システムによって生成される熱を 100% 捕捉できます。

サーバーにコールド プレートを取り付けるのではなく、Submer の浸漬冷却タンクを非導電性の液体に浸します - クリックして拡大します

クレイジーに聞こえるかもしれませんが、私たちは何十年もの間、コンピューターのコンポーネントを非導電性の液体に浸して冷却してきました。 液浸冷却を使用する最も有名なシステムの 1 つは、Cray 2 スーパーコンピューターです。

これらのシステムで使用される流体はベンダーによって異なりますが、Exxon や Castrol などの合成油や 3M の特殊な冷媒は珍しいことではありません。

Submer は、今週の SC22 でその技術を披露した浸漬冷却会社数社のうちの 1 社です。 同社の SmartPods は、チェストフリーザーに油をいっぱい入れて、サーバーを上から垂直に差し込み始めた場合に似ています。