企業が保有する膨大なデータの活用を促進する「rokadoc」のパブリックベータ版を公開
配信日時: 2025-02-19 13:45:00



ドコモグループの法人事業ブランド「ドコモビジネス」を展開するNTTコミュニケーションズ株式会社(以下NTT Com)は、生成AI・RAG※1向けデータ構造化技術である「rokadoc」のパブリックベータ版を2月19日より公開します。「rokadoc」のパブリックベータ版※2では、ドキュメント構造化機能を試用できます。
1.背景
近年、生成AIと企業が保有する膨大なデータを組み合わせて活用する事例が増えています。一方で、企業が保有するデータの多くは非構造化データ(PDF、HTML、画像、各種文書など)のため、生成AIが正しく理解することができず、期待する検索・回答精度が得られないという課題があります。
NTT Comは、こうした課題を解決し、企業における生成AI利用時のデータ活用を促進することをめざして、図表を含む非構造化データを高精度で構造化データ(タグ付けされたテキストデータ)へ変換する「rokadoc」を開発しました。「rokadoc」を利用することで、システムや製品のマニュアルをもとに質問に回答するチャットボットや、生成AIを用いた企業内ナレッジ検索時の回答精度向上への活用が期待できます。
2.本技術の概要
本技術は、非構造化データを生成AIに適した構造化データに変換します。
ドキュメントのファイル形式はWord、PowerPoint、Excel、PDFに対応し、変換したテキストは任意の生成AI技術(AIエージェント※3やRAG)と併用可能です。
画像1: https://www.atpress.ne.jp/releases/426789/img_426789_1.png
<本技術のイメージ>
3.本技術の特長
本技術の特長は以下の通りです。
(1)画像情報をテキスト形式に変換
ドキュメントにはテキストのみならず多くの画像が含まれます。「rokadoc」は独自のレイアウト解析技術により、テキストや画像を高精度に区分けし、画像からは説明文(キャプション)を生成します。
画像2: https://www.atpress.ne.jp/releases/426789/img_426789_2.png
<画像から説明文を生成しているイメージ>
(2)複雑な表構造にも対応
業務で使われる表構造にはさまざまなパターンが存在します。たとえば、結合セルの有無や罫線の有無などによりバリエーションが多くあります。「rokadoc」はこれらの形式にも対応して、構造化されたテキストで表構造を出力します。
画像3: https://www.atpress.ne.jp/releases/426789/img_426789_3.png
<表のレイアウトを解析して構造化されたテキストを出力しているイメージ>
(3)RAG併用可能
RAGで期待する結果を得るためには、第一に最適なドキュメントを取得する必要があります。
「rokadoc」をRAGの検索に適用することで、以下の図のように類似技術に比べて高い精度を確認しています。
画像4: https://www.atpress.ne.jp/releases/426789/img_426789_4.png
<他社製品の検索精度比較※4>
4.公開開始日
2025年2月19日
5.ご利用方法・料金
以下のURLからユーザー登録をお願いします。
https://rokadoc.ntt.com/
ユーザー登録後、無料でパブリックベータ版をご利用いただけます※6
6.今後の展開
今後、NTT Comは、「rokadoc」のパブリックベータ版を通じて、顧客課題やフィードバックを集めながら精度を高め、本格提供に向けた準備を進めていきます。
また、自社開発の「rokadoc」に加えて、パートナー企業と連携し、データ加工技術やデータマネジメント基盤、コンサルティングサービスなども組み合わせた統合ソリューションを2025年度から提供開始し、企業における生成AIを用いたデータ活用を推進します。
NTTドコモ、NTT Com、NTTコムウェアは、ドコモグループの法人事業を統合し、法人事業ブランド「ドコモビジネス」を展開しています。私たちは社会・産業DXのマーケットリーダーとして「つなごう。驚きを。幸せを。」をスローガンに、人と人をつなぎ、コミュニティをつなぎ、さまざまなビジネスをつなぐことで、新たな価値を生み出し、豊かな社会の実現をめざします。
画像5: https://www.atpress.ne.jp/releases/426789/img_426789_5.jpg
https://www.ntt.com/business/lp/docomobusiness/db2024_sol.html
※1:RAG(Retrieval-Augmented Generation)とは、大規模言語モデルによるテキスト生成時に、外部情報を活用して推論の精度を高める技術のことです。
※2:パブリックベータ版とは、一般のユーザーに広く公開して誰でも試用可能とするバージョンです。
※3:AIエージェントとは、ユーザーの質問から目的を理解し、自律的に目的達成に向けタスクを分解し、実行するAIシステムのことです。
※4:今回の検索精度の比較では、ベクトル検索※5から得られた関連ドキュメントが期待通りである場合(関連度1位に正解が来た場合)に1.0となるように試算するNDCGスコアを利用しました。精度測定では、各製品・技術から出力されたテキストのみを使用しており、画像を用いたベクトル検索は用いない条件で評価を実施しました。
※5:ベクトル検索とは、ユーザーの質問とドキュメントの内容を数値化(埋め込みに)し、その「意味的な近さ」に基づいて関連性の高い結果を返す技術のことです。
※6:パブリックベータ版の利用については、ユーザーごとに利用回数を制限させていただく可能性があります。
詳細はこちら
プレスリリース提供元:@Press
スポンサードリンク
「NTTコミュニケーションズ株式会社」のプレスリリース
スポンサードリンク
最新のプレスリリース
- RAG型AIチャットボット「chai+」:クラウドサービスのセキュリティ信用評価プラットフォーム「Assuredクラウド トラストページ」への掲載のお知らせ06/08 19:45
- 学割3,000円【東京・新宿】累計15万人以上の施術実績を持つメンズ眉毛サロンKEGIRAI。新宿エリアで高まる男性美容需要に対応06/08 19:15
- 【車内で世界と繋がれ】Ottocastが国際的サッカー大会開催記念キャンペーンを実施。期間限定AIBOX・限定無料ギフト・観戦応援ルーレットなど特別施策を6月5日より展開06/08 19:15
- 【初開催】土木と建築の垣根を超える展示会『建設技術総合展』がついに解禁06/08 19:15
- 【コープみらい】昭島市社会福祉協議会へのお米寄贈式を実施06/08 19:15
- 最新のプレスリリースをもっと見る
