AIエージェント・RAGの性能を実用化レベルに引き上げる データ構造化ソリューション『DX-laei』正式提供開始
配信日時: 2025-06-02 10:00:00
ドキュメント・質問文の両方を構造化。RAGの検索精度を向上させるAPIサービス
株式会社言語理解研究所(本社:徳島県徳島市、代表取締役:樫地 真確、以下「ILU」)は、社内に蓄積された非構造ドキュメント(PDF・Word・Excel等)を、生成AIが参照・回答できる“知識”へと変換する日本語特化型API群『データ構造化ソリューション DX-laei(ディーエックス レイ)』(以下、DX-laei)を開発し、2025年6月より正式提供を開始しました。
近年、生成AIの業務活用が進む中、検索拡張生成(RAG:Retrieval-Augmented Generation)の導入が広がっています。しかし、業務現場では「必要な情報にたどり着けない」「プロンプトの知識が必要」といった運用上の課題が顕在化しており、生成AIの精度と実用性を左右する“前処理の整備”が、今後の鍵を握る要素として注目されています。
『DX-laei』は、日本語に特化した自然言語処理技術を活用し、非構造データに対する「文書構造化」「検索クエリ生成」「アノテーション」の3つの機能をAPIとして提供。既存の業務環境に組み込みやすく、柔軟な導入が可能です。ILUは、日本語とAIの融合によって業務効率化と知識活用を推進する「日本語DX」の実現に取り組んでおり、DX-laeiはその中核を担うソリューションです。
本ソリューションの背景には、社内文書の多くが形式や表現の異なるドキュメントで構成され、それらが十分に整備されないままRAGの検索対象となっている現状があります。これにより、回答精度の低下や誤回答のリスクが生じています。さらに、曖昧な質問や略語・業界用語や略語を含む入力に対しては、AIの検索精度が落ちるという課題もあります。
『DX-laei』は、ドキュメントの構造化に加え、ユーザーの質問を意味的に再構成し、最適な検索クエリへと変換する機能を備えています。これにより、生成AIに必要な“入力精度”と“検索対象の整備”の両面から、RAGやAIエージェントの回答品質を底上げします。
現在は、文書構造化・検索クエリ生成・アノテーションの3系統のAPIを提供しており、目的やシステム要件に応じて単体利用・または組み合わせでの利用が可能です。いずれもSaaS型UIは持たず、柔軟なシステム組み込みを前提とした法人向けの技術提供となります。今後は、用途に応じた機能拡張も予定しています。
■ILUの強み
ILUは、徳島大学・青江研究室を前身とし、40年にわたって日本語の自然言語処理技術の研究・実用化を行ってきました。1,300万語の語彙と663億の表現パターンを収録した大規模言語データベースを保有し、生成AI以前から、多様な日本語処理ソリューションの開発・提供を継続しています。
■ 提供中の主なAPI
- ドキュメント構造化API
大規模言語データベースを参照する事前学習済みLLMによるテキスト出力と、AI-OCRによる文字認識結果を比較・分析し、それぞれの精度が高い部分を自動的に合成。構造と内容の両面で高品質なテキストを生成します。
例:表構造や図解の配置はLLM、文字情報はAI-OCRがそれぞれ補完。イラスト・表結合・フローチャートといった複雑な画像にも対応可能です。
- 検索クエリ生成API
ユーザーの質問文を形態素解析エンジンで単語に分割した後、重要な表現を抽出し、意味づけ・ゆれ補正を経て、対象文書を的確に検索できるクエリへと自動変換します。
- アノテーションAPI
テキストデータを解析し、感情・話題の分類、同義語を考慮したキーワード抽出、地域情報の特定などを行い各種アノテーションタグを自動付与。これにより、RAG検索時の文書検索精度を高め、最終的にRAGによる回答の正確性・網羅性を向上させ、応答補正にも寄与します。
これらのAPIは、すでに導入済みのRAG構成を大きく変更することなく、追加導入が可能です。
■ 日本語処理40年の知見をベースに構築
本ソリューションには、当社が長年にわたって蓄積してきた大規模言語データベースと構文解析技術が活用されています。
たとえば、構造化処理においては、文書の見出し推定や語義の曖昧性処理において、従来の統計モデルとは異なる辞書ベースの手法を併用。これにより、形式が揃っていない文書群でも、文脈を保ったまま実用レベルでの知識変換を実現します。
■ 活用シーン・導入事例(抜粋)
【社内ナレッジ検索】
社内規定や過去の問い合わせ履歴、入れ子構造を含む資料群を構造化し、ユーザーの質問意図に沿った検索・応答ができるよう最適化。これにより、社内規定や手続きに関する問い合わせ対応の効率化を実現し、業務負荷の軽減と情報活用の高度化を支援します。
【マニュアル整備による効率化】
視覚要素を多く含むマニュアル文書(アイコン・図表・星取表など)を構造化し、生成AIが理解・活用できる形式に変換。これにより、問い合わせの初期対応をチャットボットが担えるようになり、ユーザーによる自己解決を促進。有人対応の削減につながり、運用コストの圧縮と応答品質の平準化を支援します。
【制度・規約文書の応答精度向上】
金融・保険・行政などの分野で扱われる、複雑な制度文書や規約類に対して、文書構造の明示化・検索最適化・意味付けを実施。長文や定型表現が多く、対応が属人化しやすい文書群でも、生成AIが一貫した応答を行えるよう整備することで、応答品質のばらつきを抑え、対応業務の標準化と運用効率の向上を支援します。
■ 申し込み・導入相談
データ構造化ソリューション DX-laeiは部分導入・個社カスタマイズの技術支援にも対応しています。
詳細な資料、導入に関するご相談は、以下よりお問い合わせください。
詳細を問い合わせる
■ 会社概要
会社名:株式会社 言語理解研究所(Institute of Language Understanding Inc.)
Sansan株式会社グループ【証券コード:4443】
所在地:〒770-0813 徳島市中常三島町1丁目32番地1
代表者:樫地 真確
事業内容:自然言語処理技術の研究開発/法人向けAPI提供/AI活用支援コンサルティング
Webサイト:https://ilu.co.jp
■サービス・報道に関するお問い合わせ先
営業・マーケティング部
担当:川崎 涼子
info@ilu.co.jp
[画像: https://prcdn.freetls.fastly.net/release_image/76915/10/76915-10-bec14d29e64f0c61c43c6c4cdf8b47d7-1920x1005.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
PR TIMESプレスリリース詳細へ
スポンサードリンク
「株式会社言語理解研究所」のプレスリリース
- 誰でも手軽に使えるテキストマイニングサービス感情分析レポート「エモレポ」を提供開始07/26 11:00
スポンサードリンク
最新のプレスリリース
- LRN、AI活用インサイトと業界ベンチマーク機能を備えたCatalyst Revealの次世代バージョンを発表07/22 22:02
- コスモス薬品、サプライチェーン最適化と今後の事業拡大に向けてRELEXソリューションズを採用07/22 20:41
- 武田薬品、HyHubTMおよびHyHubTM DuoデバイスについてFDA 510(k)承認を取得しハイキュービア®の管理を簡素化07/22 20:04
- 【SwitchBot】高騰する電気代、変わる家事の在り方、増え続ける犯罪。今注目される「節電」「時短家電」「防犯対策」をテーマにした特設ページ公開へ07/22 19:15
- 【宮城県】石巻から始まる新しいキャリア教育の形!高校生が地元企業のミッションを解決!職業体験型ボランティア『DIVE!』開催07/22 19:15
- 最新のプレスリリースをもっと見る