レトリバ、最高精度の日本語検索向けテキスト埋め込みモデル「AMBER」を公開
配信日時: 2025-03-10 11:00:00
~日本語の検索精度向上により生成AI活用を加速~
AI技術で組織の課題解決を支援する株式会社レトリバ(東京都豊島区、代表取締役 田口琢也)は、日本語検索向けのテキスト埋め込みモデル「RetrievaEmbedding - 01 AMBER (Adaptive Multitask Bilingual Embedding Representation)」を公開したことをお知らせいたします。
本モデルは日本語検索用途に最適化されております。これにより、外部データベースの情報を検索して生成AIの出力に反映させる技術であるRAG(Retrieval-Augmented Generation)などにおいて、欲しい情報をより正確に、より速く見つけられるようになります。
本モデルの開発背景
日本企業における生成AIの活用は、欧米と比べてまだ発展途上であり、デジタル赤字やIT分野での競争力低下が懸念されています。
その中でも特に、情報の正確性や最新性を向上させるRAG(Retrieval-Augmented Generation)は、多くの企業で期待されていますが、まだ十分に活用が進んでいません。
その要因の一つとして、RAGの重要な要素であるEmbedding技術*に関して、日本語のモデルが英語に比べて十分に整備されておらず、多くの企業で検索精度が不十分なEmbeddingモデルを使用している点が挙げられます。
その結果、生成される回答の精度が低いという課題が顕在化し、日本企業のAI活用を阻む大きなボトルネックとなっています。
こうした課題を解決するため、レトリバは長年にわたり自然言語処理技術を研究・開発し、磨き上げてきたAI技術をもとに、このたび、最高精度の日本語Embeddingモデルの開発に至りました。
[画像1: https://prcdn.freetls.fastly.net/release_image/22635/82/22635-82-d99581095ab29808a0cda11f88c9e650-2336x1232.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
<注釈>Embedding:テキストを数値化(ベクトル化)し、AIが言葉の意味や文脈を理解しやすくする技術。これにより、従来の単語一致型検索では難しかったニュアンスや意味を考慮した検索が可能となり、精度が向上します。
AMBERの特長
AMBERは日本企業における社内検索に適したEmbeddingモデルです。
以下のような特徴があります。
1. 最高精度の日本語検索
AMBERは、実務に適したコンパクトなモデルサイズ(パラメータ500M以下)の中で、日本語検索において最高精度を誇るEmbeddingモデルです。
本モデルは日本語の検索精度を測るテストで、公開されているコンパクトな日本語埋め込みモデルや多言語埋め込みモデルに比べて最も高いスコアを記録しました。
[画像2: https://prcdn.freetls.fastly.net/release_image/22635/82/22635-82-804580ff81352a19b0784d046cdcfd6b-2336x1232.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
2. 英語を含むドキュメント検索性能
多くの日本企業では、社内のドキュメントに日本語と英語が混在しており、情報検索の際に言語の壁が生じることが少なくありません。
AMBERは、日本語検索において高い精度を実現しつつ、英語の情報も適切に扱うことができるため、業務環境に適したEmbeddingモデルとなります。
AMBERは以下のHugging Face Hubにて公開しており、商用利用可能なライセンスのもと提供いたします。
- AMBER large:https://huggingface.co/retrieva-jp/amber-large
- AMBER base:https://huggingface.co/retrieva-jp/amber-base
今後の展開
今後、日本企業のAI活用において「RAG」の重要性がますます高まる中、より優れたモデルの開発に努めてまいります。
また、AMBERをファインチューニングすることで、業界や企業特有の用語に特化した検索モデルの構築が可能です。これを企業とのコラボレーションを通じて実現していきたいと考えています。
株式会社レトリバについて
「AI技術で、人を支援する」をミッションに、自然言語処理と機械学習の技術を武器に、お客様が有するデータ資産の価値を引き出すことによる戦略的AI活用を支援しています。
レトリバという社名には、「Retrieval(検索)」という当社の技術領域と、狩猟犬や盲導犬として活躍するレトリバー犬のイメージの2つの意味を込めています。私たちは狩猟犬のように必要な情報を素早く届け、パートナーとしてお客様に寄り添うことで、AIによる企業活動の変革を支援していきます。
==================================================
本件に関するお問合せ:株式会社レトリバ
担当者:辻 pr@retrieva.jp
==================================================
PR TIMESプレスリリース詳細へ
スポンサードリンク
「株式会社レトリバ」のプレスリリース
スポンサードリンク
最新のプレスリリース
- 累計100万部突破「54字の物語」シリーズ、SNS投稿の書籍化が教育現場で活用されるまでに成長05/04 10:00
- Tokyo ope’lataが満を持してオペラ「蝶々夫人」を日本語訳詞で上演!05/04 10:00
- エネルギー溢れるパフォーマンスで注目度急上昇!新人K-POPガールズグループUNCHILDの大型広告が5月4日から渋谷駅に登場!05/04 09:00
- Global Leaders Converge in Bangkok for the 18th Annual Global CSR & ESG Summit & Awards 202605/04 04:54
- 物価高の中、出費がかさむゴールデンウィーク 暮らしに役立つ特別企画『とれたてっ!トクするWEEK』MC・青木源太「明るく前向きな気持ちになってもらえるように」街頭インタビューで「おにぎりの値段上昇」に悩む母に共感“物欲がない!?”東野幸治、“子どもが7人”橋下徹、“タイパ・コスパ世代”AmBitiousほか 個性派ゲストが多様な視点で知って得する家計の情報を本音トーク05/03 18:00
- 最新のプレスリリースをもっと見る
