Nous Research、AIエージェントのスキル自動生成コマンド「/learn」をリリース――ドキュメント作成の手間を解消

2026年6月28日 01:15

AI開発グループのNous Researchは、オープンソースのAIエージェント「Hermes Agent」向けに、ワークフローを自動で再利用可能なスキルに変換する新コマンド「/learn」をリリースした。開発者が手動でドキュメントを作成する負担を解消し、エージェントの動作や既存の資料から自律的に「プレイブック」を生成できる。これにより、企業における複雑な独自ワークフローの自動化が大幅に効率化されると期待されている。

■ドキュメント作成の負担を解消する「/learn」コマンド

Nous Researchは2026年6月24日、オープンソースのAIエージェント「Hermes Agent」向けの新コマンド「/learn」をリリースした。このコマンドは、AIエージェントの導入において最も根深い課題の一つであった「事前のドキュメント作成の負担」を解消するものである。/learnコマンドは、エージェントの実際の動作を監視するか、開発者が指定したソース資料を読み込むことで、その内容を再利用可能な「スキル」へと要約する。これにより、エージェントは後から単一のスラッシュコマンドでそのスキルを呼び出せるようになる。開発者は、エージェントに新しい機能を教えるために手動で「SKILL.md」ファイルを作成する必要がなくなる。既存の作業をエージェントに示すだけで、エージェント自身が自律的にプレイブックを書き上げる。

このリリースは、開発者が起動時にどのエージェント機能を有効にするかを細かく制御できる「Blank Slate（白紙）」モードのリリース（6月19日）から5日後に行われた。これら2つの機能は、Nous Researchの一貫した姿勢を示している。それは、「最初は最小限から始め、事前の設定ではなく、実際の使用を通じてエージェントのスキルセットを成長させる」というアプローチである。

■Hermes Agentの「スキルシステム」の仕組み

Hermes Agentのスキルは、オンデマンドの知識ドキュメントである。各スキルは「SKILL.md」ファイルを含むフォルダとして構成され、エージェントが関連するタスクを検出したときにロードされる。

このシステムは、トークンコストを低く抑えるために設計された「3段階の段階的開示パターン」を採用している。エージェントは常にコンパクトなインデックスのみを参照し、タスクがそれを必要とする場合にのみスキルの全内容をロードする。さらに、サポートスクリプトや参照資料にはオンデマンドでアクセスする。この設計により、開発チームはモデルのコンテキストウィンドウを毎回の呼び出しで圧迫することなく、何百ものスキルをインストールできる。これは、単純なプロンプト注入（プロンプトインジェクション）とは異なる、実用的なエンジニアリング上の工夫である。

すべてのスキルは「~/.hermes/skills/」ディレクトリに保存され、オープン規格「agentskills.io」と互換性を持つ単一のソース・オブ・トゥルース（信頼できる唯一の情報源）として機能する。インストールされたすべてのスキルは、自動的にスラッシュコマンドになる。任意のインターフェースで「/plan」や「/axolotl」を実行すると、そのスキルの指示がアクティブなターンにロードされる。このシステムは、記憶ストレージというよりも参照ライブラリに近い。スキルは将来のタスク全般に適用される手順を記録し、Hermesの独立したメモリレイヤーは、コンテキスト内に永続的に保持される小さな事実情報を管理する。

■「/learn」の技術的アプローチと動作プロセス

/learnコマンドは、手動でのドキュメント作成プロセスを不要にする。このコマンドは、ローカルディレクトリ、オンラインのドキュメントページ、過去の会話、あるいはペーストされたメモなど、あらゆるソースの記述を受け付ける。そして、エージェントは自身が持つ既存のツール（ローカルディレクトリ用の「read_file」や「search_files」、オンラインドキュメント用の「web_extract」、過去の会話や手順を直接キャプチャする機能など）を使用して素材を収集する。

その後、エージェントはNous Researchの社内標準規格に準拠した「SKILL.md」ファイルを自動作成する。これには、60文字未満の説明文、標準的なセクション順序、Hermesツールに適したフレーミングが含まれる。エージェントが実際のツールセットに存在しない架空のコマンドを捏造することはない。作成されたスキルファイルは「skill_manage」ツールを使用して保存される。なお、書き込み承認ゲートを有効にしている開発者の環境では、通常通り承認ステップが適用される。

アーキテクチャの観点から見ると、/learnは独立したデータ取り込みエンジンではない。標準規格に沿ったプロンプトを構築し、それを通常の会話ターンとしてエージェントに渡す仕組みである。並列のパイプラインを追加するのではなく、既存のツールチェーンを再利用しているため、CLI、メッセージングゲートウェイ、TUI（テキストユーザインターフェース）、ダッシュボード、さらにはローカル、Docker、リモートなどのあらゆるターミナルバックエンドで全く同じように動作する。また、Hermesのウェブダッシュボードには、グラフィカルなインターフェースを好むチーム向けに、ディレクトリフィールド、URLフィールド、テキストボックスを備えた「Learn a skill」ボタンも追加されている。

■エンタープライズにおけるユースケースと40%の高速化

Hermes Agentを本番環境にデプロイするエンジニアリングチームにとって、この機能の実用的な価値は、組織固有の複雑で反復的なワークフローにおいて最も明確に発揮される。

例えば、社内APIのオンボーディングが挙げられる。プライベートなドキュメントのURLに対して「/learn」を実行すると、エージェントは認証、ページネーション、一般的な呼び出しパターンをカバーするスキルを生成する。チームメンバーは、自らドキュメントを読むことなく、それをスラッシュコマンドとして呼び出すことができる。また、デプロイ手順書（ランブック）の記録も容易になる。ステージング環境へのデプロイ作業をエージェントに1度見せ、「今ステージングサーバーをデプロイした方法を学習して（/learn how I just deployed the staging server）」と実行すれば、その手順はCLIや接続されたすべてのメッセージングプラットフォームで再現可能になる。

2026年4月にTokenMixが実施した独立したベンチマーク調査では、20以上の自己作成スキルを持つエージェントは、同様の将来のタスクを（トークン消費量と実時間の両方の測定において）40%高速に完了するというNous Researchの主張が裏付けられた。ただし、TokenMixとNous Researchの両者が認める率直な注意点として、この向上効果はドメイン固有である。GitHubのプルリクエストのレビューから学習したスキルが、データベースの移行計画に転用されることはない。

■既知の課題：「自己賞賛バイアス」とその対策

/learnが拡張する自動スキル作成メカニズムには、文書化された弱点がある。それは、エージェントが「自己賞賛（self-congratulation）」に陥りやすいという点である。コミュニティによるテストでは、Hermesの学習ループにおける自己評価ステップにおいて、エージェントのパフォーマンスが実際には低かった場合でも、自身の成果を高く評価してしまう傾向があることが確認されている。このシステムを放置すると、手動でカスタマイズした高品質なスキルファイルを、より精度の低い自動生成バージョンで上書きしてしまう危険性がある。

Nous Researchの関連プロジェクトであり、ICLR 2026でOral（口頭発表）に採択された「hermes-agent-self-evolution」は、この問題に対処している。これは「Genetic-Pareto Prompt Evolution（GEPA）」と呼ばれるオフライン最適化パイプラインを使用し、実行トレースの分析、スキルバリアントの生成、多目的最適化を適用する。ただし、このパイプラインはデフォルトではHermesのランタイム内では動作しない。これは組み込みのセーフガードではなく、独立した別ツールとして提供されている。

■エージェントの「利用」がそのまま「訓練」になる未来

/learnコマンドは、単なる生産性向上機能にとどまらない、アーキテクチャ上の重要な意味を持っている。/learnが登場する前は、明確な役割分担が存在していた。開発者がタスクを実行するためにエージェントを使用する一方で、エージェントの機能を拡張するためには、誰かが手動で「SKILL.md」というドキュメントを作成する必要があった。この作成ステップには、スキルのフォーマット、セクションの順序、Hermesツールのフレーミング、そして60文字の説明制限などを理解する必要があり、実質的には軽量な「エージェントプログラミング」作業であった。

/learnはこの境界線を崩壊させる。開発者が「今ステージングサーバーをデプロイした方法を学習して」と実行すると、エージェントは完了したワークフローを観察し、それを将来の使用に備えた行動テンプレートとしてエンコードする。エージェントを「使うこと」と「訓練すること」の境界線は、機能的に曖昧になる。開発者にとっては単なる会話の1ターンに過ぎないものが、エージェントの視点からは「自己修正」プロセスとなる。つまり、実証された行動に基づいて、自身のプロシージャルメモリ（手続き型記憶）に新しいエントリを追加しているのである。

このパターンには前例がある。2023年、AIエージェント「Voyager」は、インコンテキスト学習から構築された成長し続けるスキルライブラリに成功したプログラムを保存することで、Minecraft内で多様なタスクを達成することを学んだ。/learnはこれと同じ原理を本番の開発者ワークフローに適用している。ゲーム環境からのフィードバック信号を「人間によるデモンストレーション」に置き換え、ゲームのタスクセットを「実際のエンジニアリング業務」というオープンエンドな多様性に置き換えたものである。

■注目ポイントQ&A

●Hermes Agentの「/learn」コマンドとは何ですか？

Hermes Agentのスキルシステムにおけるコマンドで、エージェントにワークフローを学習させることができます。ローカルのコードディレクトリの読み込み、オンラインドキュメントの取得、またはユーザーが説明・実行した手順のキャプチャを通じて、再利用可能な「SKILL.md」ファイルを自動作成します。生成されたスキルはスラッシュコマンドとなり、CLI、メッセージングプラットフォーム、ウェブダッシュボードなどの将来のセッションで呼び出すことができます。

●手動で「SKILL.md」ファイルを作成する場合と何が異なりますか？

手動で作成する場合は、フォーマットの構造、セクションの順序、60文字の説明制限、Hermesのツールセットに合わせた指示の構成などを理解する必要があります。「/learn」コマンドを使用すると、これらすべてが自動化されます。エージェントは既存のツール（read_file、search_files、web_extractなど）を使ってソース素材を収集し、仕様に準拠したファイルを自動生成します。承認ゲートが有効な場合は、保存前に開発者が内容を確認することも可能です。

●「/learn」によって、エージェントの学習方法に本質的な変化はありますか？

モデルの重みが更新されるようなファインチューニング（微調整）は行われません。しかし、「/learn」はエージェントの「利用」と「拡張」の境界線を曖昧にします。実証されたワークフローを手続き型スキルとしてエンコードすることは、観察された行動に基づいて参照ライブラリを自己修正していることを意味します。これは、機械学習の研究者が「メタ学習」と呼ぶ、事前のプログラミングではなく経験から手続き的知識を向上させるプロセスに類似しています。

●Hermes Agent의スキルベース学習における限界は何ですか？

独立したテストにより、20以上の自己作成スキルを持つエージェントは同様の将来のタスクを40%高速に完了できることが確認されていますが、これは同一のタスクドメイン内に限定されます。ある分野で学習したスキルを、無関係なタスクに転用することはできません。また、自己評価メカニズムには「自己賞賛バイアス」と呼ばれる既知の弱点があり、パフォーマンスが低くても自身のスキル出力を高く評価しがちです。これに対処するため、開発者は関連プロジェクトの「GEPA」最適化パイプラインをオフラインで利用できます。

元記事: Hermes Agent Skills: /learn Distills Any Workflow Into Reusable Slash Commands