1ラックでTOP500級の性能、NVIDIAが「Vera Rubin」を科学計算向けに正式発表 欧州23カ国で35システムが始動

2026年6月25日 00:47

NVIDIAは、ドイツ・ハンブルクで開催された「ISC High Performance 2026」にて、次世代スーパーコンピューティングプラットフォーム「Vera Rubin」を正式発表した。同システムは1ラックで従来のTOP500級の性能を実現し、科学計算とAI推論の双方を高度に処理できるとされる。同時に、欧州23カ国で35の新たなAIスパコン開発計画が進行中であることも明かされたが、一方でNVIDIAへの極端なインフラ依存に対する懸念も浮上している。

■科学計算プラットフォームとしての「Vera Rubin」と欧州の動向

NVIDIAは2026年6月22日、ドイツ・ハンブルクで開催された「ISC High Performance 2026」において、新型システム「Vera Rubin」を単なるクラウド向けAIアクセラレーターではなく、科学計算プラットフォームとして正式に位置づけた。同時に、欧州23カ国で35の新たなAIスーパーコンピューターが現在開発中であることを明らかにした。これら2つの発表は、同社が単体のGPU販売からフルスタックのHPC(ハイパフォーマンス・コンピューティング)プラットフォームの提供へと移行して以来、科学計算分野におけるフットプリントを最も集中的に拡大した1日となった。

この発表のタイミングは意図的なものとみられる。欧州連合(EU)の主権的スーパーコンピューティングに関する共同事業体「EuroHPC」は、欧州の科学における技術的自立(テクノロジー・オートノミー)を確保することを発足時の使命としている。しかし、NVIDIAによると、同社は今週時点で欧州の「AIファクトリー」構築の90%以上に電力を供給しているという。この数字は、欧州の科学担当大臣たちが答えを迫られる、ある鋭い問いを提起している。すなわち、インフラがほぼ全面的に米国ベンダー1社の独自ハードウェアとインターコネクトスタックで構築されている場合、科学計算における「欧州の主権」とは何を意味するのか、という問いだ。

■Blackwell世代からの進化:3つのアーキテクチャ刷新

科学計算向けのVera Rubinプラットフォーム(「Vera Rubin NVL4」として販売され、1ラックあたり最大144基のGPUを搭載可能)は、従来の高精度な数値シミュレーションとAI推論という、歴史的に互換性のなかった2つの計算領域を、データ変換のオーバーヘッドなしに同一ハードウェア上で実行できるように設計されている。NVIDIAによると、フル構成の1ラックは、科学的ワークロードに対して7エクサflops以上のAI性能を提供すると同時に、5ペタflopsのネイティブ倍精度(FP64)計算性能を実現するという。これは、1つの筐体だけで世界のスーパーコンピューター性能ランキング「TOP500」に名を連ねるマシンに匹敵する規模である。

なお、「7エクサflops」と「5ペタflops」という数値は異なる測定基準に基づくものであり、単純に合算すべきではない。7エクサflopsという数値は、AI推論に最適化された低精度フォーマット「NVFP4」を使用したものである。一方、5ペタflopsのFP64という数値は、TOP500ランキングと同じ精度基準を使用している。重要な技術的進歩は、Vera Rubinが同一のシリコンからこれら両方の性能を提供することだ。これはGPU実務者が長年求めてきたネイティブなFP64機能であり、前世代までは一貫して提供されていなかったものである。

NVIDIAのHPCおよびAIファクトリー・ソリューション担当シニアディレクターであるディオン・ハリス(Dion Harris)氏は、ISCでのメディアブリーフィングで次のように述べた。「ネイティブなFP64精度は、正確な流体力学、気候モデリング、地球科学において、依然として極めて重要だ。当社は今後もこのサポートを維持していく」

Blackwell世代と比較して性能が向上した背景には、3つのアーキテクチャ変更がある。

第1に、インターコネクトである。NVLink 6は、GPU間の帯域幅を双方向でGPUあたり毎秒1.8テラバイト(BlackwellのNVLink 5)から毎秒3.6テラバイトへと倍増させた。これにより、72基のGPUを搭載するNVL72ラック全体のオール・ツー・オール(総当たり)ファブリック帯域幅は、前世代の毎秒130テラバイトから毎秒260テラバイトへと倍増する。

第2に、メモリである。Vera RubinはHBM3eからHBM4へと移行し、インターフェース幅が1,024ビットから2,048ビットへと倍増した。これにより、GPUあたりの帯域幅は毎秒8テラバイトから毎秒22テラバイトへと向上し、GPUあたりのメモリ倍速スループットはほぼ3倍になる。

第3に、CPUとGPUの統合である。88コアの「Vera CPU」は、毎秒1.8テラバイトで動作する「NVLink-C2C」チップ間リンクを介して「Rubin GPU」と接続され、商用のラック規模システムとしては初めて、両者が単一のコヒーレントなファブリックドメイン下に置かれる。これにより、CPUでの前処理とGPUでのシミュレーションの間でデータがPCIe境界を越える必要がなくなり、前世代でワークロードのボトルネックとなっていた要因が解消される。

計算流体力学、格子量子色力学、分子動力学シミュレーションなど、メモリ帯域幅がボトルネックとなるワークロードにおいて、NVIDIAは前世代システムの最大4倍の性能を予測している。一方で、ISCに参加したオープンソースHPCコミュニティは、この移行に伴う実務上の課題に取り組んでいる。NVLink 5からNVLink 6への移行、新しいVera CPUアーキテクチャ、およびHBM4への移行により、既存の科学アプリケーションがその恩恵を十分に享受するためには、Spack、Kokkos(パフォーマンス・ポータビリティ・レイヤー)、MPI、およびOpenMPのランタイム構成のすべてをアップデートする必要がある。

システムビルダーであるBull、Dell Technologies、GIGABYTE、HPE、Supermicroは、ISCにおいてカスタムの高密度Vera Rubin NVL4構成を発表した。OEM各社からの提供開始は2026年第4四半期を予定している。

■欧州で進行する35システムの詳細

NVIDIAが明らかにした35のシステムは、欧州23カ国の国立スーパーコンピューティングセンター、EuroHPCのAIファクトリー、大学、産業研究機関に及んでいる。現在の波の大部分はNVIDIAのBlackwellおよびHopperアーキテクチャで動作しており、最先端の領域でVera Rubinの導入が始まりつつある。

代表的な導入事例は、ドイツのライプニッツスーパーコンピューティングセンター(LRZ)である。同センターは、HPE Crayハードウェア上に構築され、2027年に稼働開始予定の次期エクサスケール級システム「Blue Lion」にVera Rubinを導入する。Blue Lionは、LRZの現行システムの約30倍の計算能力を提供し、天体物理学、環境科学、ライフサイエンスの研究を支援する見込みだ。

バルセロナ・スーパーコンピューティング・センター(BSC)による「MareNostrum 5」のアップグレード(EuroHPCのAIファクトリーに特化した初の導入事例)では、Quantum-X800 InfiniBandで接続されたNVIDIA GB300 NVL72およびGB200 NVL4システムが使用され、約20エクサflopsのAIトレーニング容量と33エクサflopsのAI推論容量を目指している。BavariaAIの「Blue Swan」プロジェクトでは、1,000基のNVIDIA GB200 NVL4 GPUがエルランゲン・ニュルンベルク大学(FAU)とLRZに導入され、11エクサflops of AIトレーニングと22エクサflopsの推論を目指す。EuroHPC共同事業体が所有するスウェーデンのリンシェーピン大学の「Mimer AI Factory」には、100台のGB200 NVL4システムから400基のGPUが導入される予定だ。

バルセロナ・スーパーコンピューティング・センターのディレクターであるマテオ・バレロ・コルテス(Mateo Valero Cortés)氏は次のように述べている。「BSCは、科学、産業、社会を発展させるAIインフラの構築に取り組んでいる。MareNostrum 5へのアップグレードとNVIDIAのアクセラレーテッド・コンピューティングにより、スペイン、ポルトガル、トルコで構成されるコンソーシアムは、気候モデリングから生物医学的発見に至るまで、世界で最も複雑な課題のいくつかに取り組むためのツールを欧州の研究者に提供する」

これら35のシステムすべてにおいて、NVIDIAによると、同社のインフラは昨年以降に欧州で導入または発表された800AIエクサflops以上の計算能力を支えているという。

■米国国立研究所も「Vera Rubin」を採用

NVIDIAはまた、米国の3つの主要な国立研究所が同プラットフォームを採用したことを確認した。これは、連邦政府の資金提供による科学計算への取り組みが並行して進んでいることを示している。

ローレンス・バークレー国立研究所の国立エネルギー研究科学計算センター(NERSC)は、Dell Technologiesが構築する次期フラッグシップシステム「Doudna」にVera Rubinを導入する。このシステムは、大規模なHPCシミュレーション、AIトレーニング、およびエネルギー省(DOE)の科学機器に直接接続されたデータ集約型研究をサポートする。

ロスアラモス国立研究所は、アーキテクチャ上最も重要な決定を下した。HPEがCrayアーキテクチャ上で構築・提供する「Mission」「Vision」「Veritas」という3つの独立したVera Rubinシステムを導入する。最大2,160基のRubin GPUと1,080基のVera CPUで構成される「Mission」は、国家安全保障のワークロードを担当する。「Vision」(Rubin GPU 1,298基、Vera CPU 648基)は、基盤モデル、自律型AI(Agentic AI)、ならびに材料科学、原子力、核融合エネルギー、量子コンピューティングにおける複雑なシミュレーションを含む、オープンな科学研究を支援する。ISCで発表された「Veritas」(Rubin GPU 576基、Vera CPU 288基)は、科学的発見のための自律型AIを可能にするよう特別に設計されている。NVIDIAはこれを、国立研究所においてAI主導の自律的研究のために明示的に構築された初のシステムと位置づけている。

■自律型AI(Agentic AI)と新たなソフトウェアスタック

NVIDIAはISCにおいて、Vera Rubinを単に高速なスーパーコンピューターとしてだけでなく、同社が「科学のための自律型AI(Agentic AI for science)」と呼ぶ新しい計算パラダイムのプラットフォームとして位置づけた。これは、人間の指示を待つのではなく、研究タスクを自律的に実行するシステムである。

ハリス氏はISCで、メディア「The Register」に対し次のように語った。「自律型AIは、人間の科学者だけでプロセスを進める場合には不可能な規模で科学を行うための強力なツールとして、すでに台頭しつつある。エージェントは眠ることも、食べることも、休憩を取ることも必要としない。何千、何百万もの技術論文を読み込み、その詳細を記憶することができる」

ハードウェアと並行して、NVIDIAは3つの新しい科学ソフトウェアツールを発表した。「ALCHEMI」は、何百万もの分子構造をシミュレートできる化学および材料発見のためのドメイン固有ツールキットである。「DAQIRI」は、次世代の科学機器をリアルタイムのAI推論パイプラインに直接接続する。NVIDIAは欧州原子核研究機構(CERN)のATLAS実験を例に挙げ、現在は衝突データの2%未満しか分析用に保存できていないが、GPUで加速されたAIトリガーパイプラインを使用すれば、より多くのデータを保持できるようになると指摘した。「cuPhoton」は、フォトニクス(光工学)のシミュレーションワークロードを対象としている。

欧州のスーパーコンピューター構築における量子分野も、NVIDIAの「CUDA-Q」ハイブリッドプラットフォームを通じて進展している。CINECA(イタリア)、フラウンホーファー研究所、ユーリッヒ超伝導コンピューティングセンター(JSC)などの機関が、量子プロセッサーと従来のスーパーコンピューターの統合を進めている。ユーリッヒの研究者は最近、NVIDIAの「GH200 Grace Hopper Superchip」を使用したシステム「JUPITER」上で、汎用50量子ビット量子コンピューターのシミュレーションを完了した。NVIDIAはこれを記録的なシミュレーションであると説明している。

■オープンソースHPCコミュニティの課題とベンダー依存の懸念

HPCコミュニティのオープンソースソフトウェアエコシステムは、Vera Rubin世代への移行において特有の課題に直面している。新しいNVLink 6ファブリックとHBM4メモリ構造は、既存 of 科学アプリケーションにとって「プラグアンドプレイ」でアップグレードできるものではない。異種ハードウェア間で科学ソフトウェアを構築するために広く使用されているHPCパッケージマネージャー「Spack」は、新しいチップトポロジーに対応するためのアップデートが必要である。コードを全面的に書き換えることなくCPU、GPU、その他のアクセラレーター間で実行できるようにするC++パフォーマンス・ポータビリティ・レイヤー「Kokkos」は、新しい帯域幅特性に合わせたプロファイリングとチューニングが必要となる。MPIおよびOpenMPのランタイム構成も、コヒーレントなCPU-GPUファブリックドメインに合わせて調整する必要がある。

オープンソースのHPCツールのニュートラルなガバナンスを提供するLinux Foundationのプロジェクト「High Performance Software Foundation(HPSF)」は、ISC 2026をこれらの技術的課題に対処する主要な場として活用している。同財団のメンバーには、Amazon Web Services(AWS)、HPE、ローレンス・リバモア国立研究所、サンディア国立研究所、AMD、アルゴンヌ国立研究所、Intel、そしてNVIDIA自身が含まれており、この移行の課題が研究機関だけでなくエコシステム全体で認識されていることを示している。

しかし、NVLinkはオープンスタンダードではなく、NVIDIA以外のシリコンでは使用できないプロプライエタリな技術であるため、Vera Rubinアーキテクチャの性能向上はNVIDIAのハードウェアを通じてのみ享受できる。NVLinkの毎秒260テラバイトのファブリックに密接に結合した科学的ワークロードを構築する機関は、標準的な調達の多様化では容易に相殺できない依存関係を生み出すことになる。

ジェンスン・フアン(Jensen Huang)CEOは、ISCで欧州の構築について「AIは科学の新しい道具であり、欧州は何百万もの研究者の手にそれを届けるためのインフラを構築している」と大々的に語った。しかし、この発表が同時に示しているのは、その野望を実現するために構築されているインフラが、極めて高い割合で1社のハードウェアおよびソフトウェアスタックに依存しているという事実である。

EuroHPCは、欧州の研究が自らコントロールできないインフラに依存しないようにすることを目的に設立された。当初の使命では、サプライチェーンの混乱リスクを制限する、世界をリードするスーパーコンピューティングエコシステムの開発が目標として掲げられていた。AIファクトリーの計算能力の90%以上を、独自のインターコネクトを持つ単一のベンダーから調達し、そのベンダーが新しいアーキテクチャを発表するたびに科学ソフトウェアエコシステムを再構築しなければならない現状は、設立時の使命が回避しようとしていた混乱リスクそのものを抱え込んでいると言える。

Vera Rubinが提供する性能上のメリットを考慮すれば、この依存関係は許容できるものなのか、それとも代替アーキテクチャへの投資を加速させるべきなのか。欧州の研究管理者や技術担当大臣たちは、これら35のシステムが稼働し、それらを運用する機関がNVIDIAのエコシステムにますます最適化されたワークロードを構築していく中で、この問いに直面することになる。

■注目ポイントQ&A

●NVIDIAのVera Rubinスーパーコンピューターとは何ですか?Blackwellとの違いは?

Vera Rubinは、高精度な科学シミュレーションとAI推論のワークロードを同一のハードウェア上で実行できるように設計された、NVIDIAの次世代ラック規模コンピューティングプラットフォームです。前世代のBlackwellからの主な進化点として、メモリがHBM3eからHBM4に移行し、GPUあたりのメモリ帯域幅が毎秒8テラバイトから毎秒22テラバイトへとほぼ3倍に向上したことが挙げられます。また、インターコネクトがNVLink 5からNVLink 6に進化し、ラックレベルでのGPU間帯域幅が毎秒130テラバイトから毎秒260テラバイトへと倍増しています。

●欧州で発表された35の新しいAIスーパーコンピューターとはどのようなものですか?

NVIDIAがISC High Performance 2026で発表したもので、欧州23カ国の国立スパコンセンター、大学、産業研究機関などで開発が進められている35のシステムを指します。ドイツのLRZに導入される「Blue Lion」や、バルセロナ・スーパーコンピューティング・センターの「MareNostrum 5」のアップグレードなどが含まれます。これらのシステムの多くは現行のBlackwellやHopperアーキテクチャを採用していますが、最先端のシステムではVera Rubinの導入も計画されています。OEMシステムとしての一般提供は2026年第4四半期以降を予定しています。

●NVLink 6はどのように機能し、なぜ科学計算において重要なのでしょうか?

NVLink 6は、Vera Rubinプラットフォームに統合されたNVIDIA独自の第6世代GPU間インターコネクト技術です。GPUあたり双方向で毎秒3.6テラバイトの帯域幅を提供し、これはBlackwell世代のNVLink 5の2倍に相当します。72基のGPUを接続するVera Rubin NVL72ラック全体では、毎秒260テラバイトの総帯域幅を達成します。大規模な並行シミュレーションなど、GPU間で頻繁にデータをやり取りする必要がある科学計算において、このインターコネクト速度はシステムのボトルネックを解消し、ラック全体を1つの巨大なアクセラレーターとして機能させるために極めて重要です。

●欧州によるNVIDIA製スーパーコンピューターへの投資は、科学技術における主権にどのような影響を与えますか?

欧州のスーパーコンピューティング共同事業体であるEuroHPCは、技術的な自立(主権)の確保を掲げて設立されました。しかし、現在欧州で構築されているAIファクトリーの90%以上がNVIDIA製品を採用しているため、特定の米国ベンダーへの極端な依存が生じています。NVLinkなどの独自規格に最適化されたソフトウェアやワークロードを構築すると、他社製品への移行コストが非常に高くなり、将来的にNVIDIAの価格設定やロードマップの変更による影響を直接受けるリスク(ベンダーロックイン)が生じます。

元記事: NVIDIA Vera Rubin Supercomputer: One Rack, TOP500 Power, 35 European Labs Now Deploying

関連記事

最新記事