【未確認】カルパシー氏の作とされる「CLAUDE.md」10原則が流出か、AIコーディングの自律ループを制御する新ルール

2026年6月29日 18:58

Anthropicに加入したアンドレイ・カルパシー氏のものとされる、AIコーディング用の設定ファイル「CLAUDE.md」の新たな10のルールがX上で出回り、開発者の間で注目を集めている。従来の4つのルールに、自律的なAIエージェントの暴走を防ぎ自己監視を促す6つのルールが追加された。文書の真偽は公式に確認されていないが、自律ループ型ワークフローにおけるAIの制御方法として議論を呼んでいる。

■カルパシー氏の作とされる「10のルール」が流出

5週間前にAnthropicの事前学習チームに加入したアンドレイ・カルパシー（Andrej Karpathy）氏のものとされる文書が、金曜日にX（旧Twitter）上で出回り始めた。AI開発者らによると、従来のコミュニティ用テンプレートに存在する4つのルールに、新たに6つのルールを加えたこの文書は、単なるプロンプトの書き方だけでなく、エージェント型ワークフローに対する考え方そのものを変えるものだという。

この文書は、多くの開発者がすでに手に入れているものとは異なる。2026年1月下旬、カルパシー氏が自身の作業の80%を手動コーディングからエージェント駆動型に移行したとXに投稿した後、開発者のForrest Chang氏がその知見を4つのルールにまとめ、「andrej-karpathy-skills」というリポジトリとして公開した。これは2つのリポジトリを合わせて20万以上のスターを獲得し、GitHub史上最も急速に成長したファイルの一つとなった。しかし、今回出回っている文書はそれとは異なり、「同じ過ちを二度見て得られた、短いルールのリスト」というサブタイトルが付けられた10のルールからなるファイルである。

この文書の真偽は公に確認されておらず、カルパシー氏自身もコメントしていない。開発者らが反応しているのは、その文書の内容、特に従来の4つのルールには含まれていなかった「6つの追加ルール」についてである。

■すでに知られている「4つのルール」

流出とされる文書に記載されている最初の4つのルールは、コミュニティ版のファイルと同じ領域をカバーしている。これらは、大規模言語モデル（LLM）によるコーディングで最も一般的かつコストのかかる失敗パターンに対処するものだ。

「コードを書く前に考える（Think Before Coding）」は、エージェントに対し、コードを1行でも書く前に、前提条件を明示し、曖昧な点を洗い出し、推測するのではなく質問することを求める。「シンプル第一（Simplicity First）」は、出力するコードを、提示された課題を解決する最小限のものに制限する。憶測に基づく抽象化や、要求されていない機能の追加は禁止する。「ピンポイントの変更（Surgical Changes）」は、タスクに隣接するコードの編集を禁止する。変更されたすべての行は、要求された内容に直接紐づいていなければならない。「ゴール駆動の実行（Goal-Driven Execution）」は、作業開始前に、曖昧な指示を検証可能な成功基準に変換する。例えば「認証機能を追加する」という指示は、5つの具体的な検証可能成果に書き換えられる。

Claude Codeを数回以上使用したことのある開発者であれば、これら4つの失敗パターンをすべて経験しているはずであり、だからこそコミュニティ版は急速に普及した。しかし、コミュニティ版が対処していないのは、コードが書かれた後、すなわちエージェントが実行、評価し、処理を継続するかどうかを判断するフェーズである。

■自己監視を促す「6つの追加ルール」

流出とされる文書に追加された6つのルールこそが、開発者たちが注目している部分である。

「検証（Verification）」は、正しそうに見えるコードと、実際に動作するコードのギャップを埋める。このルールでは、バグを修正する前に、そのバグを確実に再現するテストを書くことを規定している。コードを修正し、テストを実行する。テストが合格して初めてバグが修正されたとみなされ、エージェントが「修正された気がする」と判断しただけでは完了としない。自律的なループには各ステップに人間のレビュー担当者がいないため、この制約はループの文脈において極めて重要となる。

「ゴール駆動の実行（拡張版）」は、10のルール版では、コミュニティ版よりもさらに踏み込んでいる。文書ではこれを中心的な規律と位置づけ、コードを書く前に、機械が検証できる形で「完了」の定義を定めるよう求めている。「バリデーションを追加する」では不合格であり、「空白または不正な形式のメールアドレスを入力したユーザーに特定のエラーメッセージが表示され、両方のケースでテストが合格する」であれば合格となる。複数ステップにわたる作業では、自律生成によって誤った方向に進むのを防ぐため、まず計画を立てる。

「デバッグ（Debugging）」は、エラーとスタックトレースを完全に読み、修正を試みる前に問題を再現し、一度に1つの変数のみを変更するという具体的な手順を定めている。これは、曖昧なエラーメッセージを勝手に解釈し、存在が確認されていない問題に対する修正コードを生成してしまう「自信に満ちた誤診」を防ぐためのものである。

「依存関係（Dependencies）」は、追加されたすべてのパッケージを、自分がコントロールできないスケジュールで他者によって更新される、永続的で制御不能なコードとして扱う。ライブラリを導入する前に、標準ライブラリで対応できないかを問い、依存関係を追加する場合はその決定を明示的に文書化する。

「コミュニケーション（Communication）」は、有用な不確実性と、曖昧な安心感を明確に区別する。「このライブラリがストリーミングをサポートしているか確信が持てない」は実用的な情報だが、「これで動くと思う」はそうではない。不確実な状況において、自信ありげな推測を行うことを禁止している。

最後の「一般的な失敗パターン（Common Failure Modes）」は、最も特徴的なルールであり、エージェントが自身の行動において認識し、停止すべき4つの繰り返しパターンを挙げている。

1. キッチンシンク（Kitchen Sink）：蛇口の修理を頼まれたのに、台所全体をリフォームしてしまう。
2. 誤った抽象化（Wrong Abstraction）：同じロジックが3箇所に現れているのに、それを関数化すべきだと認識できない。
3. 楽観的パス（Optimistic Path）：正常系のみのコードを書き、不正な入力や接続切れ、サーバーエラーなどを無視する。
4. 暴走するリファクタリング（Runaway Refactor）：連鎖を止めるルールがないため、1つのファイルが10個に増えてしまう。

これらのパターンを検知した場合、作業を完了させようとせず、即座に停止することが規定されている。

■従来のテンプレートとの違いと「ループエンジニアリング」

従来の4つのルールのテンプレートは、AIエージェントに「コードの書き方」を指示するものだった。一方、今回の10のルールの文書は、AIエージェントに「自身の推論を監視する方法」を指示している。つまり、いつ立ち止まり、いつ途中で前提を疑い、自分が陥っているパターンにどのような名前がついているかを認識させるものである。

文書の概要には、モデルは「もっともらしく見えるコード」を生成することには長けているが、「もっともらしく見えること」と「実際に正しいこと」のギャップを検出することには長けていない、と明記されている。追加された6つのルールは、その検出の規律を外部から課すように設計されている。

この違いは、AI支援開発の現状に直接結びついている。Claude Codeの開発者でありAnthropicの責任者であるボリス・チェルニー（Boris Cherny）氏は、2026年6月に広く拡散されたインタビューの中で、自身のワークフローにはもはやプロンプトの作成が含まれていないと述べた。「私はもうClaudeにプロンプトを投げていない。Claudeにプロンプトを投げ、何をすべきかを判断するループを実行している。私の仕事はループを書くことだ」と語っている。この発言は、OpenAIのエンジニアであるピーター・スタインバーガー（Peter Steinberger）氏も同時に同調し、Googleのエンジニアであるアディ・オスマニ（Addy Osmani）氏によって名付けられたもので、開発者コミュニティが目指す方向性のシフトを示している。それは、自らの出力を評価し、軌道を修正し、検証可能な条件が満たされるまで実行を続ける自動化システム（ループエンジニアリング）である。

この枠組みにおいて、4つのルールのファイルは「ターンごとの挙動」に対処し、追加された6つのルールは「ループ全体の挙動」、すなわち各ステップに人間のレビュー担当者がいない状態でエージェントが動作しているときに何が起こるかに対処している。検証ルールは、誰も各イテレーションを監視していないときにこそ重要であり、名前のついた失敗パターンは、1時間実行されるループが誤った方向へ進んで数千行のコードに悪影響を及ぼすのを防ぐために重要となる。

■Claude Codeにおける「CLAUDE.md」の仕組みとセキュリティリスク

この文書の影響力を理解するには、その技術的な仕組みを理解する必要がある。プロジェクトディレクトリでClaude Codeが起動すると、ルートにある「CLAUDE.md」という名前のファイルを読み込み、その内容をシステムプロンプトとしてではなく、会話のコンテキスト（プロジェクトコンテキスト）として注入する。Anthropicの公式Agent SDKドキュメントによると、「CLAUDE.mdは異なる経路をたどる。SDKがこれを読み込み、システムプロンプトではなく、プロジェクトコンテキストとして会話に注入するため、選択したシステムプロンプトと並行して動作を規定する」とされている。

一方、Claude Codeの別の機能である「Rules」は異なり、エージェントがそのパスパターンに一致するファイルにアクセスするたびに、リマインダーとしてコンテキストに再注入される。Claude Codeのシステムプロンプト全体は約2,300〜3,600トークンであり、付随するツール定義がさらに14,000〜17,000トークンを追加する。CLAUDE.mdの内容はこれらに加えて、セッション開始時に一度だけコンテキストに注入される。

実用上の意味として、CLAUDE.mdの内容は動作に影響を与えるものの、強制力はない。文書の指示は行動のコンテキストにすぎず、十分に具体的なプロンプトインジェクションによって上書きされる可能性がある。Adversa AIとLayerXは、クローンされたリポジトリに配置された悪意のあるCLAUDE.mdファイルが、Claude Codeに対してSSHキーやAPI認証情報を盗み出すパイプラインを生成するよう指示していた事例を報告している。Anthropicは、Claude Codeバージョン2.1.90で関連する脆弱性に対処した。開発者は、カルパシー氏のガイドラインをコピーやフォーク、出所のわからないミラーからではなく、GitHub上の公式リポジトリ（forrestchang/andrej-karpathy-skills または multica-ai/andrej-karpathy-skills）からのみダウンロードすべきである。

2026年5月にClaude Codeバージョン2.1.139に追加された「/goal」コマンドは、4つのルールと10のルールの両方の文書における重要な原則を具現化している。これは、コードを書いたモデルとは別の、より高速な検証用モデルを使用して、各ターンの後に完了条件が満たされているかどうかをチェックする。このアーキテクチャ上の分離こそが、ゴール条件付きループを単なるプロンプトの繰り返しと区別するものであり、流出文書の新しい6つのルールが、単一セッションではなくループの文脈に特に適している理由である。

■文書が具体化したもの

この10のルールの文書が出回ったことで、予想通りの議論が巻き起こっている。内部の作業用ファイルをチーム外に共有すべきかどうか、単一の設定文書が最先端モデルの挙動を測定可能なほど変化させることの意味、そして10のルール版のより厳格な要件がコミュニティ版の4つのルールよりもデフォルトとして優れているかどうか、といった議論である。

一方で、これらのルールが機能するかどうかについては、それほど議論の余地はない。さまざまなプラットフォームで、この10のルールを適用した開発者からは、セッションの最初のメッセージの性質が変わったという報告が寄せられている。モデルはコードを書く前に読み、デプロイする前にチェックし、前提を置く前に質問するようになる。その違いが新しい6つのルールによるものか、元の4つのルールによるものか、あるいは単に期待値を明示すること自体によるものなのかは、現在のデータからは断定できない。

しかし、この文書が具体的に示したのは、ループエンジニアリングの議論が数週間にわたって巡らせてきた問い、すなわち「言われた通りに動くツール」と「いつ止まるべきかを知っているツール」の違いである。

■注目ポイントQ&A

●10のルールが記載されたCLAUDE.mdは、本当にカルパシー氏がAnthropicで使用している個人用ファイルなのですか？

この文書は、Anthropicの事前学習チームにいるカルパシー氏の知人を通じて流出したとされ、金曜日にX上で出回り始めました。その真偽は第三者によって確認されておらず、カルパシー氏自身も公にコメントしていません。コミュニティで知られている4つのルール版は、開発者のForrest Chang氏が2026年1月のカルパシー氏のX投稿を基に作成したという明確な起源がありますが、今回の10のルール版の出所は未確認です。読者の皆様におかれましては、この内容を開発者コミュニティ発の情報として扱い、帰属ではなく内容そのものの有用性に基づいて評価することをお勧めします。

●CLAUDE.mdは実際にどのようにClaude Codeの挙動を変化させるのですか？

このファイルの内容は、Claude Codeのセッション開始時に会話のコンテキストに注入されますが、システムプロンプトに注入されるわけではありません。Anthropicのドキュメントによると、CLAUDE.mdは「選択したシステムプロンプトと並行して動作を規定する」とされています。これらの指示はモデルに影響を与えますが、完全な遵守を保証するものではありません。これらは行動のコンテキストであり、強制力のあるルールではないためです。また、これが文書の出所が重要となる理由でもあります。クローンされたリポジトリに悪意のあるCLAUDE.mdファイルが含まれていた場合、ユーザーが許可していない操作を実行するようClaude Codeに指示する危険性があります。

●ループエンジニアリングとは何ですか？なぜこれらのルールが重要なのですか？

ループエンジニアリングとは、AIコーディングエージェントにプロンプトを送り、出力を評価し、検証可能なゴールが達成されるまで処理を繰り返す自動化システムを構築する手法を指し、人間を毎回のやり取りから排除します。Claude Codeの開発者であるボリス・チェルニー氏は2026年6月に、自身の仕事はプロンプトを書くことではなくループを設計することだと説明しています。この文脈において、流出した文書の新しい6つのルールが重要なのは、ループ規模でのエージェントの自己監視に対処しているためです。バグが「修正された」とみなす前にテストの合格を義務付ける検証ルールは、開発者が監視しているときよりも、人間が介在せずに何時間もループが実行される場合に、はるかに大きな意味を持ちます。また、「キッチンシンク」や「暴走するリファクタリング」といった名前のついた失敗パターンは、エージェントが間違いを修正する代わりに悪化させようとしていることを自ら認識するための語彙を提供します。

●自律ループでAIコーディングエージェントを実行する際の実際のコストはどのくらいですか？

自律エージェントのループにおけるトークンコストは、対話型セッションよりも大幅に速く累積します。エージェントがファイルの読み込み、テストの実行、コードの編集などのツール呼び出しを行うたびに、ステートレスなLLM APIに対して会話履歴全体が再送信されるためです。研究によると、エージェント型のタスクは通常のチャットの約4倍のトークンを消費し、マルチエージェントシステムでは最大15倍のコストに達することがあります。対策を講じていないループが、一晩で数千ドル（約32万〜146万円、1ドル＝162円換算）のAPIコストを発生させた事例も報告されています。実用的な解決策は、10のルールの文書が検証や停止条件を重視しているように、ループ開始前に明確な完了基準を定義し、モデルの制御外で厳格なトークン予算制限を設定することです。

元記事: Karpathy CLAUDE.md Grows to Ten Rules: New Self-Check Protocol for AI Coding Loops