AWSが第5世代の192コア自社開発CPU「Graviton5」を一般提供開始――エージェント型AIワークロードに最適化

2026年6月16日 22:23

Amazon Web Services(AWS)は、自社開発プロセッサーの最新世代となる「Graviton5」の一般提供を、新たなAmazon EC2インスタンスを通じて開始した。本プロセッサーは、従来のGPUではなくCPUへの依存度が高いとされる「エージェント型AI(自律的に思考しタスクを実行するAI)」の実行管理(オーケストレーション)処理に最適化して再設計されている。

Amazon Web Services(AWS)は、自社開発のプロセッサー「Graviton5」の一般提供を開始した。これは新たな「Amazon EC2 M9g」および「M9gd」インスタンスを通じて提供される。AWSは、この低消費電力のArmベースCPUを、リアルタイム推論やコード生成、複数ステップのタスクオーケストレーション(実行管理)といった「エージェント型AI」のワークロード向けプラットフォームとしてアピールしている。

「AWS re:Invent 2025」で初めてプレビュー公開され、2026年6月10日にローンチされたGraviton5は、Amazonのカスタムサーバー向けチップの第5世代にあたる。今回の発表において、バージョン番号以上に重要なのはその位置づけだ。AWSは、汎用CPUをエージェント型AIに最適化する形で明確に再設計している。この種の処理は、GPUではなくCPUに大きく依存することが明らかになってきているためだ。

■なぜエージェント型AIがCPUの課題になるのか

大規模モデルのトレーニング(学習)はGPUの役割だ。しかし、段階的に思考し、ツールを呼び出し、コードを生成し、多くの並行環境を立ち上げるAIエージェントの処理では、その時間の多くが「オーケストレーション」に費やされる。これは、分岐処理、調整、データの並べ替えといった、CPUが得意とする処理だ。

CPUの処理が追いつかなければ、高価なアクセラレーター(GPUなど)がアイドル状態(待機状態)になってしまう。AWSは、Graviton5がこうしたアクセラレーターに効率的にデータを供給し続けるために設計されたと主張しており、同チップの設計上の選択もその主張に沿っている。

Graviton5は、TSMCの3ナノメートル(nm)プロセスを採用した4チップレット構成で、EC2で最高水準のコア密度となる192個の「Arm Neoverse V3」コアを搭載している。さらに、前世代比で5倍の大容量とする192MBのL3キャッシュ、AWSが「クラウド最速」と謳うDDR5-8800メモリ、そしてPCIe Gen 6に対応する。

これらの主要スペックの背景にある仕組みを理解しておく価値がある。前世代のGraviton4は96コアのCPUを2基使用していたため、あるコアがもう一方のソケットにあるデータを必要とする際、インターコネクト(接続経路)を経由する必要があった。AWSのコンピューティング担当バイスプレジデントであるデビッド・ブラウン氏によれば、これには「最大3倍の時間がかかる可能性があった」という。

Graviton5では、すべての192コアを単一のソケットに統合し、キャッシュ容量を大幅に拡大した。これにより、キャッシュミスとソケット間のレイテンシ(遅延)の双方を削減している。これこそが、メモリ帯域がボトルネックになりやすく、高度な並行処理が求められるエージェント型の処理を、AWSが主要なユースケースとして前面に押し出している理由である。すでに12万社以上の顧客がGravitonを利用しており、AWSによると、Metaはエージェント型AI向けに数千万コアを導入することを決定したほか、UberやSnowflakeも導入を進めているという。

■パフォーマンスに関する主張と、その情報源

ここで示されているパフォーマンスの数値は、ほぼすべてがAWS自身による公表値である。同社によると、M9gインスタンスはGraviton4と比較して最大25%高い演算性能を提供し、コア間のレイテンシを最大33%削減するという。また、ウェブアプリケーションや機械学習の推論を最大35%高速化し、データベース処理を最大30%高速化するとしている。

さらにAWSは、プレビュー版を利用した顧客からの報告も紹介している。ClickHouseはコード変更なしで36%のパフォーマンス向上を報告し、Honeycombは本番環境での6カ月間にわたるA/Bテストで1コアあたりのスループットが36%向上したと言及、HubSpotはMySQLのクエリ実行時間が最大60%短縮されたと述べている。これらは現実味のある数値だが、あくまでベンダー(AWS)側から提供された、あるいはベンダーが取り次いだ数値であり、いずれも「最大で」という但し書きが付いている。ローンチ時点では、第三者による独立したベンチマーク結果はまだ公開されていない点に留意する必要がある。

AWSの説明によると、ネットワークとストレージの帯域幅も向上しており、ネットワーク帯域幅は平均で最大15%向上、Amazon EBSの帯域幅は平均で20%向上し、最大サイズのインスタンスではネットワーク帯域幅が最大2倍になるという。高速なローカルストレージ向けに構築されたM9gdインスタンスは、最大11.4TBのNVMe SSDを搭載し、前世代と比べてIOPS(秒間I/O処理数)が最大30%向上している。また、メモリサブシステムに関して、AWSは「DDR5-8800」を主要スペックとして宣伝しているが、社外の報道によると、現時点では7200MT/sで動作しており、8800MT/sモジュールは現在開発中と指摘されている。

■単一のチップにとどまらないAWSの賭け

Graviton5のローンチは、より大きな業界シフトにおける一手である。AWSによると、過去3年間に同社が追加した新規CPU容量の半分以上をGravitonが占めており、カスタムチップ事業の年間ランレート(年換算売上高)は200億ドル(約3兆2,000億円、1ドル=160円換算。為替変動の影響を受ける)を突破したという。

Graviton5の192コアというスペックは、AMDの最上位製品のコア数に匹敵し、Intelの製品を上回る。これは、Googleの「Axion」やMicrosoftの「Cobalt」と並び、ハイパースケーラー各社がカスタムArmチップへと移行し、データセンターにおけるx86アーキテクチャの支配力を着実に切り崩している動きの一環と言える。

どちらのインスタンスタイプも第6世代の「AWS Nitro System」上で動作する。これは、ネットワーク、ストレージ、セキュリティ、および管理処理を専用のNitroカードにオフロード(肩代わり)することで、メインCPUが顧客のワークロード処理に専念できるようにするシステムだ。AWSによると、この新世代のNitroは、サーバーの演算能力とメモリのほぼすべてをワークロードに提供すると同時に、AWS自身のオペレーターを含む他のシステムや人物がEC2サーバーにログインしたり、インスタンスのメモリを読み取ったり、顧客データにアクセスしたりすることを防ぐという。

注目すべきは、この分離状態を保証するために、テストや監査ではなく、特定の特性が満たされていることを数学的に証明する手法である「形式検証(フォーマルベリフィケーション)」を「Nitro Isolation Engine」に採用しているとAWSが主張している点だ。これが実証されれば非常に厳密なアプローチとなるが、現時点ではあくまでAWS側の主張にとどまる。同社は、顧客がその実装と証明結果をレビューできるようにする計画だとしているが、現時点ではまだ実施されていない。

■注目ポイントQ&A

●AWS Graviton5とはどのようなプロセッサーですか?

Graviton5は、Amazonが開発した第5世代のカスタムArmベースサーバー向けプロセッサーです。2026年6月10日より「Amazon EC2 M9g」および「M9gd」インスタンスを通じて提供が開始されました。TSMCの3nmプロセスを採用し、4つのチップレットで構成されたシングルパッケージに192個の「Arm Neoverse V3」コアを搭載しています。192MBのL3キャッシュ、DDR5メモリ、PCIe Gen 6に対応しており、AWSはエージェント型AIワークロードのほか、一般的なクラウドワークロード向けとして位置づけています。

●なぜGraviton5は「エージェント型AI」向けとしてアピールされているのですか?

段階的に思考し、コードを生成し、多くの並行環境を管理する「エージェント型AI(AIエージェント)」の処理においては、GPUなどのアクセラレーターよりも、処理の実行管理(オーケストレーション)を行うCPU側に大きな負荷がかかります。CPUの処理が追いつかないと、高価なアクセラレーターがアイドル状態(待機状態)になってしまいます。AWSは、Graviton5の多数のコア、大容量キャッシュ、高速なメモリがこうした並行環境の処理をスムーズに進め、アクセラレーターへ効率的にデータを供給し続けられると主張しており、エージェント型AIのユースケースを前面に出しています。

●Graviton5は従来のx86チップよりも高速ですか?

AWSは自社の前世代チップ「Graviton4」に対して大幅な性能向上を報告しており、Graviton5の192コアはAMDの最大コア数に匹敵し、Intelの製品を上回ると指摘しています。しかし、ローンチ時点で公表されている性能値は、あくまでAWSによる「最大で」という主張値であり、競合する現行のx86サーバー向けチップと比較した第三者による独立したベンチマーク結果はまだ公開されていません。そのため、直接的な性能比較については現時点では未検証の状態です。

元記事: AWS Rebuilds Its Server CPU Around Agentic AI With the 192-Core Graviton5 Launch

関連記事

最新記事