Azure上で「Claude」が一般提供開始、最新の「Sonnet 5」も対応――企業の調達・ガバナンスの壁を解消

2026年7月3日 23:09

Microsoftのクラウドサービス「Azure」上で、AnthropicのAIモデル「Claude」がネイティブにホストされ、一般提供（GA）が開始された。これにより、企業は新たな契約を結ぶことなく、既存のAzure契約やクレジットを利用して最新の「Claude Sonnet 5」などを導入できるようになる。企業の調達やガバナンスのハードルを大きく下げる動きとして注目される。

■調達の壁を取り払う「Azure上のClaude一般提供」

Microsoft Foundryにおいて、AnthropicのAIモデル「Claude」がネイティブにホストされ、一般提供（GA）が開始された。これにより、企業はすでに運用しているIDおよびアクセス制御ポリシーのもとで、Azureを通じてClaudeの利用料金を支払うことができるようになる。2026年6月29日と7月1日の2段階にわたって行われたこの発表は、企業がClaudeを導入する際の最大の制度的障壁、すなわちAnthropicと個別の商用契約を締結し、新たなベンダー関係を管理する必要性を排除するものだ。

既存の「Microsoft Azure Consumption Commitment（MACC）」を持つ企業チームは、事前にコミットしているAzureの予算枠からClaudeの利用料を差し引くことができる。これは、調達のためにAnthropicと直接取引する必要があった従来には存在しなかった財務的な選択肢である。

今回のローンチにより、3つのClaudeモデルが相次いでAzureホスト型の本番環境に投入された。6月29日には「Claude Opus 4.8」と「Claude Haiku 4.5」がFoundryで一般提供開始となり、7月1日には、現在Claudeの個人向けおよびチーム向けプランのデフォルトとなっているAnthropicの最新モデル「Claude Sonnet 5」がこれに続いた。

■GAがもたらす実質的な変化と「シャドーAI」対策

多くの企業におけるAIプロジェクトは、モデルの品質が原因で停滞するわけではない。Azureのプロダクトリードであるスティーブ・スウィートマン氏が6月29日のAzure公式ブログで指摘したように、プロジェクトが滞る原因は「モデルの周辺にあるもの、すなわち調達、ガバナンス、ネットワーキング、そしてデータ」である。今回の一般提供は、まさにこれらの課題を解決するものだ。

これまでは、Azureを通じてClaudeをデプロイしたい開発者は、AnthropicのAPIにアクセスすること自体は可能だったが、課金、ID管理、セキュリティレビューはAzureのガバナンスの枠外にあった。標準的なベンダー承認プロセスに従う中央IT部門は、Anthropicを独自のセキュリティ評価、データ処理合意、請求書を持つ個別のベンダーとして扱わなければならなかった。この摩擦により、多くの組織が「無期限のパイロット（実証実験）状態」に留まり、モデルの能力はあっても本番環境への移行経路が確立できない状況が続いていた。

今回のリリースにより、この摩擦は解消される。開発チームは「Microsoft Entra ID」で認証を行い、Azureのロールベースのアクセス制御（RBAC）を適用し、モデルごとの詳細が記載された統合された1枚のAzure請求書を受け取ることができる。Claudeの利用料は「Claude Consumption Units（CCU）」として課金され、Azure Marketplaceの請求書に一括して記載される。Microsoft Enterprise Agreementを締結している対象顧客は、この利用料を既存のAzure消費コミットメントのクレジットから充当できるため、これまで管理外だったAIツールを、財務部門がすでに管理している支出カテゴリへと統合できる。

この調達の簡素化は、企業におけるAI導入の構造的な課題である「シャドーAI」問題の解決にも寄与する。セキュリティレビューやベンダー審査に数ヶ月を要することで中央IT部門の承認が遅れると、開発チームは個人アカウントや非公式なルートを通じてツールを勝手に利用しがちになる。その結果、組織が監査できない利用、把握できないデータ、帰属不明なコストというガバナンスの空白が生じる。

ClaudeがAzureの既存のガバナンススタックに統合されたことで、すでにプラットフォームとしてAzureを承認しているIT部門は、新たなセキュリティレビューを行うことなく、既存の枠組みの中でClaudeの利用を許可できる。Entra ID認証、ロールベースのアクセス制御、プライベートネットワーキング、データレジデンシーの設定など、関連するすべての制御は、すでに運用している同一の管理インターフェースを通じて行われるためである。

極めて高い機密性が求められるワークロードに対しては、APIコールの完了後にプロンプトや生成結果をAnthropic側で保持しない「データ保持ゼロ（zero data retention）」オプションが利用可能だ。また、データレジデンシーの要件に応じて、グローバルまたは米国のデータゾーンを選択できる。なお、Anthropicが推論の実行を担当し、データ処理者およびSLA（サービス品質保証）の提供者となる。

運用上の注意点として、現在Azureホスト型のFoundryにおけるClaudeモデルは、米国東部2（East US 2）およびスウェーデン中部（Sweden Central）のリージョンでのみデプロイ可能である。また、スタートアップ向けアカウント、無料試用版、および従量課金制の支払い方法が設定されていないAzureサブスクリプションは対象外となり、アクティブな有料のAzureサブスクリプションが必要となる。

■NVIDIA GB300 Blackwell Ultraが支えるハードウェア層

Azure上のClaudeは、第5世代の「NVLink」と「Quantum-X800 InfiniBand」ネットワーキングで接続された「NVIDIA GB300 NVL72」システム上で稼働する。この組み合わせは、単なるマーケティング上のアピールではなく、アーキテクチャとして何を実現できるかという点で極めて重要である。

GB300 NVL72は、72基のBlackwell Ultra GPUと36基のArmベースのGrace CPUを液冷方式で1つのコヒーレントな計算ドメインに統合したラック規模のシステムである。1つのラックで1.1 exaFLOPSのFP4演算性能を提供し、前世代のBlackwellと比較して1.5倍のAI性能を実現する。このアーキテクチャは意図的に推論処理に比重を置いて設計されており、Blackwell Ultraは標準のBlackwellと比較して、NVFP4演算性能が50%向上し、トランスフォーマーモデルの推論で大半を占めるアテンション層の加速が2倍になっている。これにより、1つのGB300ラックは、同等のHopper世代のシステムと比較して、最大50倍のAIファクトリー出力性能を発揮するという。

また、72基のGPU構成を低遅延で機能させるために、Quantum-X800 InfiniBandファブリックが不可欠となる。InfiniBandはRDMA（Remote Direct Memory Access）を使用し、OSのカーネルを完全にバイパスしてネットワーク接続されたシステム間でデータを直接転送する。これにより、標準的なEthernetの遅延が20〜80マイクロ秒であるのに対し、相互接続の遅延を3〜5マイクロ秒にまで短縮する。この差は、推論中に数十基のGPUを同期させ続ける必要がある場合に極めて重要となる。高速なInfiniBandがなければ、ネットワークがボトルネックとなり、GPUの計算能力を十分に活用できなくなる。

Foundry Agent Serviceが想定しているような、大量のエージェントワークロードにClaudeをデプロイする企業チームにとって、このハードウェアアーキテクチャは、大規模運用におけるスループット容量とトークンあたりのコストを直接左右する要素となる。

■推論コストを最大半分に削減する「モデルルーター」

Foundry内で利用可能なMicrosoftの「モデルルーター」機能は、企業におけるAI導入の実質的なコスト課題に対処する。多くの本番ワークロードは複雑さが混在しているにもかかわらず、大半の組織は、実際のリクエスト内容に関わらず、すべてのリクエストに対してプレミアムモデルの料金を支払っているのが現状である。

モデルルーター自体は、ルールエンジンではなく、トレーニングされた機械学習モデルである。システムメッセージ、ユーザーメッセージ、ツール定義、会話履歴を含む、入力される各プロンプトをリアルタイムで分析し、設定されたプール内の最適なモデルにルーティングする。シンプルなプロンプトはより高速で安価なモデルに、高度な推論を必要とする複雑なプロンプトはプレミアムモデルに振り分けられる。ルーティングの決定に伴うオーバーヘッドは極めて小さく、推論時間全体のごく一部にすぎない。Microsoftによると、これによりユーザーの満足度を向上させつつ、最大50%のコスト削減が可能になるという。これは、シンプルなリクエストに対しては、軽量なモデルの方がより迅速に応答を返せるためである。

このアーキテクチャは、企業におけるAIの経済的ボトルネックが、有能なモデルの存在ではなく、インテリジェントなディスパッチ（振り分け）の欠如にあるという本質的な洞察を反映している。さらに「Foundry Control Plane」は、顧客が定義したルールに基づいてエージェントの応答を継続的に評価し、ルールに違反する出力をユーザーに届く前にブロックできる。これにより、手動のモデル管理では大規模に再現できないガバナンスレイヤーが追加される。

■最新モデル「Claude Sonnet 5」の性能と料金体系

Anthropicが6月30日に個人向けおよび開発者向けプランの新しいデフォルトモデルとしてリリースした「Claude Sonnet 5」は、7月1日にMicrosoft Foundryで一般提供が開始された。Sonnet 4.6のアップグレードとして構築されたSonnet 5は、エージェントとしての性能が大幅に向上している。具体的には、ツールの利用能力の強化、複数ステップにおける一貫性の向上、そして従来はOpusクラスのモデルを必要としていたコーディングや文書ワークフローにおける信頼性の改善が図られている。

企業向けとして、Sonnet 5はFoundryにおいて、2026年8月31日までのプロモーション価格で提供される。料金は100万入力トークンあたり2ドル（約322円、1ドル=161円換算）、100万出力トークンあたり10ドル（約1,610円、1ドル=161円換算）である。プロモーション期間終了後は、100万入力トークンあたり3ドル（約483円、1ドル=161円換算）、100万出力トークンあたり15ドル（約2,415円、1ドル=161円換算）の標準価格が適用される（為替レートは1ドル=161円で換算、以下同様）。

ただし、Sonnet 5は新しいトークナイザーを採用しており、同じテキストに対してSonnet 4.6と比較して約30%多くのトークンをエンコードする。そのため、見かけ上のトークン単価の割引は、従来のモデルの標準料金と比較して実質的にコストニュートラル（同等）となる。移行を検討しているチームは、一律のコスト削減を想定するのではなく、自社のプロンプト分布に基づいてベンチマークを実施すべきである。

競争環境の観点から見ると、OpenAIのモデルは長年にわたり「Azure OpenAI Service」で提供されており、今回のClaudeと同様のシングルサインオン（SSO）、ポリシー、および課金の統合による恩恵を受けてきた。Anthropicの一般提供開始は、企業の購買担当者が重視する調達やID管理の面において、OpenAIとのガバナンス上の格差を埋めるものである。

■先行導入企業の事例とMicrosoftの戦略

初期の本番ユーザーの事例は、Foundryの統合がどれほどの規模で機能しているかを示している。AIテストプラットフォームを提供するMomenticの共同創業者であるジェフ・アン氏は、Microsoft Foundry上でClaudeのOpusモデルを稼働させることで、顧客が信頼できる安定性のもと、1分あたり数百万トークンを提供できていると報告している。

また、Everstarの創設プロダクトリードであるマット・ホアン氏は、規制の厳しい技術環境においてClaudeが実現する実質的な効果について説明した。この統合により、同原子力技術企業は、これまで人間が200日を要していた安全分析をわずか1日に短縮することができたという。ホアン氏は「AnthropicとAzureの組み合わせにより、世界最高の機能と世界最高のセキュリティを同時に手に入れることができた。これこそが、原子力分野に求められていたものだ」と述べている。

2025年11月に発表されたMicrosoft、NVIDIA、Anthropicの戦略的提携が、今回のローンチの基盤となっている。GB300ハードウェアのデプロイや、Foundry Agent ServiceのアーキテクチャにおけるNVIDIAの関与は、いずれもこの初期の合意に端を発している。

Microsoftにとって、このローンチの枠組みは、モデルへのアクセス提供に留まらない。「Microsoft IQ」はエージェントに企業のリアルタイムなコンテキストへのアクセスを提供し、Claudeの推論能力をMicrosoftのエコシステム内にすでに存在するデータと接続する。Microsoftによれば、これによりトークンあたりの価値が劇的に向上するという。また、Foundry Agent Service内のエージェントオプティマイザーは、エージェントの挙動を定義するプロンプトをチューニングし、使用するモデルに関わらずパフォーマンスを向上させる。

Microsoftのこのアーキテクチャは、明確な戦略的ポジションを反映している。すなわち、ガバナンス層、課金関係、およびIDインフラを自社で押さえつつ、最先端のフロンティアモデルのレイヤーにおいては特定のモデルに依存しない「モデルアグノスティック」な立場を維持するという戦略である。Foundryは現在、Fortune 500企業の80%を含む8万社以上の企業デベロッパーに利用されている。Claudeを追加し、FoundryをClaudeとGPTクラスの双方のフロンティアモデルを提供する単一のプラットフォームとして位置づけることで、個々のモデルではなく、プラットフォームそのものが企業との永続的な関係を築く基盤となる。

■注目ポイントQ&A

●Microsoft FoundryでClaudeを利用する際、Anthropicと個別の契約を結ぶ必要がありますか？

いいえ、必要ありません。企業は既存の有料Azureアカウントを通じてClaudeにアクセスでき、課金、ID管理、ガバナンスはすべてAzure経由で処理されます。また、Microsoft Enterprise Agreementをお持ちの対象顧客は、既存のAzure消費コミットメント（MACC）のクレジットをClaudeの利用料に充当できます。ただし、無料試用版やスタートアップ向けのスポンサー付きサブスクリプション、アクティブな従量課金制ではないアカウントは対象外です。

●Claude Sonnet 5とはどのようなモデルですか？また、Microsoft Foundryでの利用料金はいくらですか？

Claude Sonnet 5は、Anthropicの最新のSonnetクラスモデルで、2026年7月1日からMicrosoft Foundryで一般提供されています。Sonnet 4.6と比較して、ツールの利用、複数ステップのタスク完了、コーディングワークフローなどのエージェント性能が向上しています。料金は、2026年8月31日までのプロモーション価格として、100万入力トークンあたり2ドル（約322円、1ドル=161円換算）、100万出力トークンあたり10ドル（約1,610円、1ドル=161円換算）です。それ以降は、標準価格の3ドル（約483円、1ドル=161円換算）および15ドル（約2,415円、1ドル=161円換算）が適用されます。なお、Sonnet 5は新しいトークナイザーを採用しており、同じテキストでもSonnet 4.6より約30%多くのトークンとしてカウントされる点にご注意ください。

●NVIDIA GB300 Blackwell Ultraハードウェアは、Claudeの推論性能にどのような影響を与えますか？

GB300 NVL72は、72基のBlackwell Ultra GPUを第5世代のNVLinkとQuantum-X800 InfiniBandネットワーキングで接続したラック規模のシステムです。Blackwell Ultraは、従来のBlackwellハードウェアと比較して、低精度演算性能が50%向上し、アテンション層の加速が2倍になっており、大規模言語モデルの推論に最も重要な処理を高速化します。また、InfiniBandネットワーキングはRDMA技術を使用して相互接続の遅延を3〜5マイクロ秒に抑え、複数GPUによる高速推論時のネットワークボトルネックを防ぎます。

●Azure上のClaudeは、Anthropicのインフラで直接ホストされているClaudeと完全に同じですか？

完全に同じではありません。現在、Azureホスト版（Foundry）では、米国東部2およびスウェーデン中部のリージョンにおいて、Claude Opus 4.8、Claude Haiku 4.5、Claude Sonnet 5のグローバルスタンダードデプロイメントがサポートされています。Azureネイティブパスでまだ利用できないモデルやAPI機能については、引き続きAnthropicが直接ホストするオプションを利用できます。MicrosoftとAnthropicは、将来的には両者の機能やモデルの差異をなくすことを目標としています。

元記事: Claude on Azure Hits Production: Sonnet 5 GA Clears Procurement Barrier for Enterprises