AWSとNvidiaが提携拡大、Blackwell搭載「EC2 G7」とGPU加速ベクトル検索を発表
2026年6月26日 17:46
AWSとNvidiaは、AIモデルの運用コスト削減と効率化に向けて提携を拡大した。Nvidiaの次世代アーキテクチャ「Blackwell」を採用した新しい「Amazon EC2 G7」インスタンスの提供を開始したほか、「Amazon OpenSearch Serverless」においてGPUによるベクトル検索をデフォルトでサポートする。これにより、企業は大規模なAI推論や検索システムをより安価かつ容易に構築できるようになると期待されている。
■「Blackwell」をミドルレンジへ:EC2 G7インスタンスの登場
AWSが一般提供を開始した「EC2 G7」インスタンスは、Nvidiaの「RTX PRO 4500 Blackwell GPU」とカスタム仕様の第6世代Intel Xeonプロセッサを搭載している。AI推論、グラフィックス、空間コンピューティング、GPU加速アナリティクスなどの用途をターゲットにしている。
AWSの発表によると、G7は前世代のG6と比較して、AI推論性能が最大4.6倍、グラフィックス性能が最大2.1倍に向上しているという。最大8基のGPU(総ビデオメモリ256GB)、G6の7倍となる700 GbpsのEFA(Elastic Fabric Adapter)ネットワーク、最大7.6TBのローカルNVMeストレージをサポートする。
AWSは、このチップを提供する最初の主要クラウドプロバイダーであると自負している。G7は、大規模な学習用クラスターではなく、推論やレンダリング、ビデオ処理、仮想デスクトップなどに適したミドルレンジの選択肢として位置づけられている。まずは米国のオハイオとオレゴンの2リージョンで6月18日から一般提供が開始された。
■普及帯を狙うAWSのインフラ戦略
この位置づけには明確な意図がある。G7は、AWSが2026年1月に提供を開始した、より大型の「RTX PRO 6000 Blackwell GPU」を搭載する「G7e」ファミリーの下位に位置する。G7eが大規模な生成AIモデル向けのプレミアムなワークステーションであるのに対し、G7はより一般的な推論、グラフィックス、アナリティクス業務にBlackwellを導入するための「普及型(ボリュームティア)」とされている。
これにより、開発チームは過剰なスペックのハイエンドハードウェアを導入することなく、「適切なワークロードに適切なアクセラレーター」を割り当てることが可能になる。これは、学習用クラスターの性能記録を更新するような華やかな動きではないが、実務においてはより大きな影響を与える可能性がある。
■検索の高速化:GPUによるベクトル検索をデフォルトに
データの検索・抽出の面では、AWSは次世代の「Amazon OpenSearch Serverless」のすべてのコレクションにおいて、Nvidiaの「cuVS」ライブラリをベクトルインデックス作成のデフォルトに採用した。これにより、RAG(検索拡張生成)、セマンティック検索、レコメンデーションシステム、エージェント型AIなどを構築する開発チームは、これまで専門的な最適化プロジェクトが必要だったGPU加速ベクトル検索を、AWSの標準機能として利用できるようになる。
ベクトル検索は、現代のAIにおいて重要な役割を果たしている。キーワードの一致ではなく、テキストや画像などのデータを意味を表す数値のリスト(ベクトル)に変換し、多次元空間内で最も近い点を特定することで類似の情報を検索する。このインデックス作成には膨大な計算量が必要となるが、並列計算を得意とするGPUがその処理に適している。
Nvidiaによると、cuVSを使用することで、CPUのみで構築する場合と比べて、ベクトルインデックスの作成が最大10倍高速化され、コストは4分の1に抑えられるという。これにより、10億規模のベクトルデータベースを1時間未満で構築することが実用可能になる。これがOpenSearch Serverlessにデフォルトで組み込まれたことで、開発者は独自のGPUパイプラインを構築・調整することなく、この恩恵を受けられるようになる。
■実用フェーズを見据えたクラウドAIの競争
Nvidiaは「このコラボレーションは、AWSのAIインフラストラクチャ層全体の強化に焦点を当てている」と説明しており、運用の負担を増やすことなく拡張できるプロダクション規模のインフラを提供することを目指している。これら2つの取り組みは、最新のシリコンを一部のエリートクラスターだけに留めるのではなく、モデルを動かす計算資源とデータを供給する検索機能という、企業AIの実用的なミドルレンジ全体にBlackwellクラスの能力を普及させようとする意図的な動きを示している。
ここには競争上の優位性もある。RTX PRO 4500をマネージドなミドルレンジインスタンスに導入することで、AWSは競合するハイパースケーラーがまだ対応していない領域を押さえることになる。Google CloudやMicrosoft Azureは、このミドルレンジ帯において、同様のBlackwell搭載マネージドインスタンスを提供していない。
クラウドAIの次のフェーズが、誰が最大のGPUを貸し出すかではなく、誰が適切なサイズのGPUを安価かつ容易に提供できるかによって決まるのであれば、今回の発表はその競争を強く意識したものと言える。なお、年内にはフランクフルトと東京の各リージョンへの拡大も予定されている。
■注目ポイントQ&A
●Amazon EC2 G7インスタンスとは何ですか?
Nvidiaの「RTX PRO 4500 Blackwell Server Edition GPU」と、カスタム仕様の第6世代Intel Xeonプロセッサを搭載した、新しいAWSのクラウドインスタンスタイプです。前世代のG6と比較して、AI推論性能が最大4.6倍、グラフィックス性能が最大2.1倍に向上しています。大規模なモデル学習用ではなく、AI推論やグラフィックスレンダリング、空間コンピューティング、仮想デスクトップなどに適したミドルレンジの選択肢として位置づけられています。2026年6月18日に、オハイオとオレゴンのリージョンで一般提供が開始されました。
●GPU加速ベクトル検索とcuVSとは何ですか?
ベクトル検索は、AIによる「類似性」の検索を支える技術です。データを意味を表す数値ベクトルに変換し、高次元空間でクエリに最も近いベクトルを検索します。「cuVS」は、このベクトルインデックスの構築処理をCPUではなくGPUで行うためのNvidiaのライブラリです。Nvidiaによると、cuVSを使用することで、CPUのみの場合と比べてインデックス作成が最大10倍高速化され、コストは4分の1に削減されます。AWSは、次世代のOpenSearch Serverlessにおいて、このcuVSをベクトルインデックス作成のデフォルトに採用しました。
●ベクトル検索はどのような用途に使われますか?
RAG(検索拡張生成)、意味に基づいて結果を探すセマンティック検索、レコメンデーションシステム、コンテキストを取り込んで動作するエージェント型AIなど、多くの現代的なAIアプリケーションの基盤となっています。これらのシステムでは、数十億ものデータの中から最も関連性の高い項目を迅速に見つけ出す必要があり、それを可能にするのがベクトルインデックスと検索です。
●G7とG7eの違いは何ですか?
どちらもBlackwellベースのインスタンスファミリーですが、ターゲットが異なります。2026年1月に提供開始された「G7e」は、より大型の「RTX PRO 6000 Blackwell GPU」を搭載し、大容量のメモリを備えているため、大規模な生成AIモデルや極めて重いレンダリング処理に適しています。一方、「G7」はより小型の「RTX PRO 4500 GPU」を使用しており、そこまでの大容量メモリを必要としない一般的なタスクを、よりコスト効率よく並列実行するための普及型(ボリュームティア)として位置づけられています。
元記事: Nvidia and AWS Deepen Ties to Speed AI Inference and Vector Search