ヴェッキオ橋を成功させる第2世代Xe-HPCアクセラレーター

今週ドイツのハンブルクで開催されるISCHighPerformance 2022で、インテルは3年ぶりの対面バージョンのイベントを使用して、高性能/スーパーコンピューターのシリコン計画の状態を更新します。 今年のショーの大きなニュースは、IntelがPonte Vecchioアクセラレーターの後継機を指名していることです。これは、同社が現在RialtoBridgeとして開示しているものです。

以前は「PonteVecchioNext」としてIntelのロードマップに表示されていましたが、Ponte自体(Auroraスーパーコンピューター)の最初の大規模なインストールがまだ立ち上がっているにもかかわらず、IntelのGPUチームはPonteの後継機の開発をパイプラインで進めてきました。 CPUとアクセラレーターがFalconShoresXPUに統合されるまでの、同社の3年間のロードマップの一部として、リアルト橋は、しゃれを許せば、 ポンテとファルコンの間のギャップ。新しいテクノロジーと製造プロセスを利用したポンテのデザインの進化を提供します。

Intelはプロセスの早い段階で完全に詳細な技術的内訳を提供していませんが、大まかに言えば、Intelは仕様について少し話しているだけでなく、Ponteの後継者であるという疑いをすべて取り除く将来のチップのレンダリングを提供しています。ポンテと同じレイアウトの数十のタイル/チップレットで構成されていることを示しています。 Intelが今日話している最大の変更は、Xeコンピューティングコアの総数をポンテの128からリアルトブリッジの最大160に拡大することです。おそらく、各コンピューティングタイルのXeコアの数を増やすことによってです。

製造面に関する具体的な詳細がない場合、Intelは少なくとも、RialtoがTSMC N7(Link Tile)、TSMC N5(Compute)、およびIntel 7(Cache)の現在の組み合わせを置き換えて、新しい製造ノードを使用して構築することを確認しています。 &ベース)パーツ。 Intel 4プロセスは今年オンラインになる予定なので、それを使用してベースとキャッシュをアップグレードすることは理にかなっています。 理想的には、インテルはコンピューティングタイルのプロセスノードにもジャンプしたいと考えています。おそらくこの機会を利用して、これらのタイルの生産をインテル4に移しますが、TSMCN4もカウントしません。

そうは言っても、単一のレンダラーに読みすぎるリスクがあるため、Rialtoは、コンピューティングコアに関して、Ponteとの顕著な違いが1つあります。Ponteは、キャッシュタイルを間に挟んだコンピューティングコアのペアを使用していましたが、Rialtoは一見するとモノリシックスラブを使用しているようです。 これは、IntelがRamboキャッシュをオンダイでコンピューティングタイルと統合することを選択し、より少ない、より大きなコンピューティングタイルを作成することをいとわないことを意味します。 これは、Intelがコンピューティングタイルの製造を引き継いでいるという考えにある程度の信憑性を与えます(すでにキャッシュタイルを作成しているため)が、Intelが後で発表する内容を確認する必要があります。

興味深いことに、IntelはRialtoのI / O帯域幅を増やすことも約束していますが、これも非常に高レベルの(そして特定されていない)詳細です。 ポンテはすでにPCIe5.0接続で出荷された最初の製品の1つであり、PCIe 6.0ハードウェアはまだ少しずれているため、これはオフチップ帯域幅よりもオンチップ帯域幅、またはインテルのを使用するアクセラレータ間で利用可能な帯域幅の量に関するものである可能性がありますXeLink相互接続。

HBM3は、今年すでにアクセラレーターの出荷が開始されていることを考えると、Intelの次世代アクセラレーターのシューインでもあります。 HPCアクセラレータは、メモリ帯域幅に基づいてほぼライブとダイを実行するため、IntelがRialtoで最初に検討したのはそれであると予想されます。 また、メモリ帯域幅はギガ転送で測定されることが多いため、Intelの厄介な表現の「MoreGT/s」と一致します。

最後に、Intelは、RialtoがOpen Accelerator Module(OAM)ソケット仕様の新しいバージョンに基づいていると述べています。これは、OAMの次のバージョンがまだ発表されていないため特に注目に値します。 詳細がない場合、最大の差別化要因はサポートされている電力のようです。OAM1.xではモジュールが最大700ワットを消費できるのに対し、Intelはリアルトモジュールで最大800ワットを消費することについて話し合っています。 これは、良くも悪くも、次世代HPCアクセラレータの最高性能バージョンの消費電力の増加と一致しており、ハイエンドハードウェアの液体および液浸冷却への移行の大きな要因です。

GPUアクセラレータの比較を計算する
AnandTech インテル インテル NVIDIA
製品 リアルト橋 ヴェッキオ橋 H100 80GB
建築 Xe-HPC Xe-HPC アンペア
トランジスタ 100 B 80 B
タイル(HBMを含む) 31? 47 6+1スペア
計算ユニット 160 128 132
マトリックスコア 1280? 1024 528
L2 / L3 2 x 204MB 50MB
VRAM容量 128 GB 80 GB
VRAMタイプ HBM3? 8 x HBM2e 5 x HBM3
VRAMの幅 8192ビット 5120ビット
VRAM帯域幅 3.0 TB / s
チップツーチップ合計BW 64 x 11.25 GB / s
(4×16 90G SERDES)
18 x 50 GB / s
CPUコヒーレンシー はい はい NVLink4を使用
製造 Intel 7
TSMC N7
TSMC N5
TSMC N4
フォームファクター OAM 2.0(800W) OAM(600W) SXM4(400W *)
発売日 2023年半ば(サンプリング) 2022年 2022年
*一部のカスタム展開は最大600Wになります

全体として、IntelはRialtoブリッジを使用して「アプリケーションレベル」のパフォーマンスを30%向上させることを目標としています。 これは最初は大きな利益ではありませんが、元のヴェッキオ橋から約1年後に発売される部分でもあります。 Xeコアの数が25%増加したということは、このパフォーマンスの向上のほとんどは、クロック速度の変更ではなく、追加のハードウェアによって実現される必要があることを意味しますが、Intelは理論上のスループットではなく、実際のパフォーマンスの期待値を引用しているため、リアルトの紙のスペックがまだ少し豊富だったとしても、それほど驚くことではありません。 Intelはまた、RialtoがPonteよりも効率的であるべきだと約束しています。これは、パフォーマンスが消費電力よりも速く上がるはずなので、額面通りの主張です。

Intelのロードマップによると、リアルト橋は2023年半ばにサンプリングを開始する予定です。 インテルがヴェッキオ橋を時間どおりに出すのに苦労していることを考えると、オーロラでなければそれを手に入れることはできません。これは、インテルにとって驚くほど迅速なターンアラウンドタイムになります。 しかし同時に、これらは非常に強力なアーキテクチャの類似性を備えたパイプライン設計であるため、理想的には、インテルはポンテほど多くの歯が生える問題をリアルトで経験することはありません。 しかし、いつものように、インテルが次のアクセラレーターの提供に近づくと、来年実際に何が起こるかがわかります。

すべての道路はファルコンショアーズに通じています

IntelのHPC計画にRialtoBridgeが追加されたことにより、同社の現在のシリコンロードマップは次のようになります。

HBMを搭載したXeonとHPCの両方のアクセラレータラインは、2024年にIntelの最初の柔軟なXPUであるFalconShoresと統合される予定です。 Falcon Shoresは、今年初めのIntelの冬季投資家会議で最初に発表され、各タイルタイプの構成可能な数を可能にすることで、高性能CPUおよびGPUタイルを論理的な結論に導くIntelの最初の製品になります。 その結果、Falcon Shoresは、混合CPU / GPU設計だけでなく、(比較的)純粋なCPUおよびGPU設計も網羅しているため、IntelのHPCCPUとHPCGPUの両方の後継です。

今日のイベントでは、IntelはFalcon Shoresの詳細を提供していません。そのため、同社は、エネルギー効率から計算密度、メモリ帯域幅まで、すべてを5倍に増やすことを目標にしています。 計画されたパッケージングと共有メモリ技術に依存することに加えて、彼らがそれをどのように達成しようとしているのかはまだ分からない。 ただし、このアップデートでは、現在のHBM-XeonおよびXe-HPC製品がどのように統合されるかを確認することで、FalconShoresがIntelの製品ロードマップのどこに適合するかをより正確に把握できます。

最終的に、Falcon Shoresは、HPC業界におけるIntelのパワープレイとして残ります。 同社は、すべての人に単一のAPIを使用して緊密に統合された(ただし、タイル化された柔軟な)エクスペリエンスを提供できることが、HPC市場で優位に立ち、従来のGPUベースのアクセラレータよりも優れていると確信しています。 そして、それらの計画を実現できれば、2024年はハイパフォーマンスコンピューティング業界で非常に興味深い年になりつつあります。

Leave a Comment

Your email address will not be published.