関連記事
テスラ、今秋にも「Grok」によるFSD音声操作を導入へ――駐車位置の記憶機能も追加とマスク氏が言及

Photo by Vlad Tchompalov on Unsplash[写真拡大]
テスラの運転支援システム「Full Self-Driving(FSD)」に、xAIが開発したAIアシスタント「Grok」による自然言語での音声操作機能が今秋にも導入される見通しだ。イーロン・マスク氏が明らかにしたもので、早ければ2026年9月頃の実現が期待されるが、テスラの過去の例からリリースの遅れも懸念される。この機能はAI4(AMDプロセッサ)搭載車両が対象となる見込みで、ドライバーは画面を操作することなく、口頭で詳細な走行・駐車指示を出せるようになるという。
■マスク氏、9月に初の「Grok-FSD」本格統合を示唆
テスラのFSDシステムが、これまでで最も重要なヒューマン・マシン・インターフェースのアップグレードを迎えようとしている。2026年6月18日、イーロン・マスク氏はX(旧Twitter)上で、同氏の企業であるxAIが開発したAIアシスタント「Grok」が、自然言語による音声コマンドを受け付け、それをFSDの計画スタックに直接伝達できるようになると認めた。この機能は「約3ヶ月後」に提供される予定であり、目標時期は2026年9月頃とみられる。これにより、テスラオーナーはタッチスクリーンを操作することなく、車に目的地や走行ルートを指示できるようになる可能性がある。
この発表は、あるテスラオーナーが「Uberのドライバーに話しかけるようにFSDに指示したい(例:『Grok、ここを右折して』『ここで降ろして、後は歩くから』『まず入り口の近くに駐車してから、外に出ていって』など)」という要望を投稿したことに対する返答として行われた。テスラ関連メディアの『Not a Tesla App』がこのやり取りとマスク氏の回答を最初に報じている。
さらにマスク氏は、FSDに永続的な駐車設定の記憶機能が追加されることも認めた。これにより、システムは特定のドライバーが「常にガレージにバックで入れたい」あるいは「ドライブウェイに頭から突っ込んで止めたい」といった好みを記憶できるようになる。この詳細は、日常の運転において最も手動介入(オーバーライド)を発生させやすい摩擦点を解消することを狙っている。
■アーキテクチャの仕組み:Grokは「意図の解釈」を担い、直接制御は行わない
この統合の真の意味を理解するには、現在の車内におけるGrokの役割と、秋のアップデート後の役割を区別する必要がある。現在、Grokはナビゲーション、情報検索、位置情報に基づくリマインダーなどの会話レイヤーを処理しているが、FSDのニューラルネットワーク自体へのアクセス経路は持っていない。車両のステアリング、ブレーキ、速度、車線変更の決定はすべて、8台のカメラからの情報をミリ秒単位で処理する独立したエンドツーエンドのニューラルネットワークによって実行されている。Grokは完全に異なるレイヤーで動作しており、xAIのサーバーによるクラウド推論に依存している。
このクラウド推論のアーキテクチャこそが、今回の統合で解決すべき制約となっている。自動運転における大規模言語モデル(LLM)の研究では、クラウドベースのLLMシステムのエンドツーエンドの推論遅延は1.2秒から5秒に達すると報告されている。一方で、車両の制御ループには50ミリ秒から100ミリ秒の応答速度が求められる。物理的な制約と遅延を考慮すると、LLMがリアルタイムのステアリングやブレーキ操作を安全に直接行うことは不可能である。
したがって、マスク氏が説明しているのは「Grokが車を運転する」ということではない。Grokがドライバーの「入り口の近くに駐車して」「ここを右折して」といった口頭での目標状態を解釈し、その構造化された意図をFSDの計画レイヤーに渡し、FSDが安全性に必要な速度と精度でニューラルネットワークを介して実行するという仕組みである。LLMが「意味」を扱い、ニューラルネットワークが「運動」を担う。
この2レイヤーのアーキテクチャ(LLMレベルでの意図解析と、ニューラルネットワークレベルでのリアルタイム制御)は、主要な自動運転研究グループが収束しつつある設計原則と同じである。これにより、LLMをミリ秒単位の意思決定ループから排除して遅延問題を解決しつつ、ドライバーに真に会話的なインターフェースを提供することが可能になる。
現在の生産バージョンであるFSD V14は、すでに大幅にアップグレードされたニューラルネットワークを採用している。これは2024年にリリースされたV12システムの約30倍の規模で動作する「Mixture of Models」アーキテクチャであり、運転状況に応じて専門のサブネットワークを選択する学習済みルーティングメカニズムを備えている。さらに、2026年4月のMLIRコンパイラの書き換えにより、反応時間がさらに20%削減された。Grokはこのシステムスタックに対して指示を渡すことになる。
■今秋のアップデートで「できること」と「できないこと」
この統合により、自然言語のコマンドによってFSDの高レベルなルート選択や駐車の意思決定を変更できるようになる。マスク氏の6月18日の投稿と、2026年2月の『Not a Tesla App』による確認に基づくと、以下の機能が予定されている。
1. リアルタイムの方向指示:特定の交差点を曲がる、特定の道路を避ける、あるいはデフォルトのナビゲーション目的地ではなく特定の入り口で乗客を降ろすようFSDに指示すること。
2. 駐車設定の指示:どこに、どのような向きで、どの入り口や特徴物に関連して駐車するかをその場で指定し、システムが自動的に選択する設定を上書きすること。
3. 永続的な位置記憶:頻繁に訪れる目的地での好みの駐車設定をFSDが記憶し、同じ指示を繰り返し出す手間を省くこと。
一方で、今回のアップデートでも変更されない点がある。FSDのリアルタイムな車線変更、ブレーキ操作、速度管理、障害物への対応などは、すべてニューラルネットワークの自律的な意思決定ループ内に留まり、Grokの自然言語レイヤーとは完全に分離されたままである。Grokが安全に関わるリアルタイムの決定を上書きすることはできず、FSDが達成しようとする高レベルの目標状態を調整することしかできない。
また、変わらない制約として、この統合にはAI4(AMDプロセッサ)ハードウェアが必要となる。古いIntelベースのインフォテインメントプロセッサを搭載した車両では、FSDと統合された完全なGrok機能は利用できない見込みであり、制限された高遅延バージョンのみが提供される可能性がある。
■チャットボットからコパイロットへ:車載Grokの進化
今回の発表は、2025年7月のデビュー以来、車載Grokの進化における第4の段階を示している。ソフトウェアアップデート2025.26で初めて導入された当時、Grokは質問に答えるだけのチャットボットであり、車両の機能を制御することはできなかった。その後、2025年のホリデーアップデートでナビゲーションコマンド(経由地の追加、スーパーチャージャーの検索、ルート変更など)が追加され、画面に触れることなく操作できるようになった。
2026年春のアップデート(ソフトウェアv2026.14)では、ハンズフリーのウェイクワード「Hey Grok」や位置情報に基づくリマインダーが導入され、グローバル展開が拡大した。この時点で残されていた課題が、マスク氏が今回解決しようとしている「マップ上の目的地だけでなく、車がどこをどのように走るかを直接指示する機能」である。
この秋のアップデートが予定通りに提供されれば、LLMが音声を通じてFSDの運転目標をリアルタイムに変更する本物の権限を持つ初めての事例となる。Rivianは2026年5月に車両制御と深く統合されたアシスタント「Hey Rivian」を導入しており、Mercedes-BenzもOpenAIと提携してMBUXインフォテインメントシステムにChatGPTを組み込んでいるが、いずれもテスラの設計のように自然言語コマンドを自動運転の計画スタックに直接ルーティングするものではない。
■タイムラインにおけるテスラオーナー周知の懸念
マスク氏の「約3ヶ月後」という表現は目安であり、確約されたものではない。テスラには、ソフトウェア機能を楽観的なタイムラインで発表し、実際には数ヶ月以上遅れて提供するという一貫したパターンがある。そのため、9月という目標は確固たるコミットメントではなく、開発の方向性として理解すべきであり、無線アップデート(OTA)による配信前にGrokとFSDの計画インターフェースを構築・検証するために必要なエンジニアリング作業が残されていることを示している。
とはいえ、今回の目標に向けたインフラは、これまでのGrok発表時よりも大幅に成熟している。「Hey Grok」のウェイクワードはすでに提供されており、FSD V14.3は数百万台の車両で動作している。また、Grokのグローバル展開も十分に完了しており、統合機能を受け取るユーザーベースはすでに整っている。残されたエンジニアリング作業は、ゼロからシステムを立ち上げることではなく、Grokの意図解析器とFSDの計画レイヤーとの間のインターフェース構築に特化している。
■テスラが直面する規制と安全性の背景
今回のGrokとFSDの統合発表は、テスラの自動運転に対する主張への規制当局の監視が強まっているタイミングで行われた。マスク氏の投稿の2日前である2026年6月16日、エドワード・マーキー上院議員とリチャード・ブルーメンソール上院議員は、米運輸省道路交通安全局(NHTSA)のジョナサン・モリソン長官に対し、テスラのFSD安全統計に関する完全なレビューを求める書簡を送付した。両議員は、テスラのデータ分析が「誤解を招く不完全なものである」と指摘しており、2026年7月7日までにNHTSAからの回答を求めている。
NHTSAは現在、FSDを搭載した320万台のテスラ車両を対象に、3つの調査を並行して進めている。これには、リコール要求の一歩手前となる「エンジニアリング分析」も含まれており、視界不良時にFSDが車両や道路の特徴を検出できない問題に焦点を当てている。
テスラはFSDが人間の運転よりも大幅に安全であると主張し続けている。現在進行中の調査はいずれも、未発売である今回のGrok統合を直接対象としたものではない。しかし、これらは新しいFSD機能が導入される規制環境の厳しさを示しており、秋のアップデートが最終的に答えなければならない疑問を提起している。それは、「音声コマンドがFSDの安全制約と衝突した場合、計画レイヤーでその衝突はどのように解決されるのか」という点である。
■注目ポイントQ&A
●Grokは実際にテスラの運転(ステアリングやブレーキなど)を直接制御するのですか?
いいえ、直接制御は行いません。Grokは「ここで右折して」といった自然言語の指示を解釈し、FSDの計画レイヤーに伝える役割を担います。実際のステアリングやブレーキ、車線変更などのリアルタイムな運転操作は、FSDのニューラルネットワークが処理します。これは、クラウド経由のLLM処理には1.2〜5秒の遅延が発生するため、安全な運転制御に必要な50〜100ミリ秒の応答速度を満たせないという技術的な理由によるものです。
●GrokによるFSD音声操作はいつから、どの車両で利用可能になりますか?
イーロン・マスク氏は2026年9月頃(「約3ヶ月後」)を目標として示していますが、提供時期が遅れる可能性もあります。また、この機能を利用するにはAI4(AMDプロセッサ)を搭載したハードウェアが必要であり、古いIntel製プロセッサを搭載した車両は対象外となる見込みです。さらに、Grokはクラウド推論を利用するため、月額約9.99ドル(約1,600円、1ドル=161円換算)の「Premium Connectivity」の契約が必要になるとみられます。
●従来のテスラの音声コマンドとGrokの違いは何ですか?
従来の「Hey Tesla」システムは、あらかじめ決められた特定のフレーズを認識して対応する機能を実行する仕組みでした。一方、Grokは大規模言語モデル(LLM)を使用しているため、日常的な話し言葉(自然言語)や複数ステップの指示、文脈を理解した複雑な要求に対応できます。今秋のアップデート後は、画面を操作することなく、口頭で詳細な駐車位置などの希望を伝えることが可能になります。
●Grokの音声操作が安全に機能するためには、FSDの自動運転レベルが向上する必要がありますか?
いいえ、その必要はありません。FSD(Supervised)は、SAE基準で「レベル2(運転支援)」に分類されており、ドライバーは常に周囲を監視し、いつでも運転に介入できる状態を維持する必要があります。Grokの統合は、ドライバーがシステムに希望の動作を伝えるためのインターフェースを改善するものであり、自動運転のレベルやドライバーの監視義務そのものを変更するものではありません。
元記事: Tesla FSD Grok Voice Control Arrives This Fall With Parking Memory, Musk Says
※この記事はTech Timesから提供を受けた記事を日本向けに翻訳・編集したものです。
スポンサードリンク

