東芝、音声認識や対話応答・翻訳・要約などをこなすクラウドサービス「RECAIUS」

2015年7月4日 17:11

印刷

RECAIUSの利用シーンイメージ(写真:東芝発表資料より)

RECAIUSの利用シーンイメージ(写真:東芝発表資料より)[写真拡大]

  • RECAIUSの機能要素のイメージ(写真:東芝発表資料より)

 東芝は2日、音声や映像のなかの言葉や人物を捉えて、その意図や状況を理解し、人にわかりやすく伝えるクラウドサービス「RECAIUS(リカイアス)」を提供開始すると発表した。

 同社によると、「RECAIUS」は、人がICTを意識して利用するのではなく、ICTが人の意図や状況に合わせて適切に動作するための仕組みづくりに貢献するサービス。人が持つ「見る、聴く、話す」能力をICTで補完し、言語や表現などの言葉の違い、音声・映像・文字といった形態の違いをこえて、安心・安全・快適に過ごせる社会の実現を目指すという。

 「RECAIUS」は、同社が長年培った音声認識、音声合成、顔・人物画像認識、知識処理技術を融合し、これらの能力を最大限に引き出せるよう、必要な知識を日々進化させられるクラウド上で構成される。さまざまな言葉の表現や人の動き・態度から意図や状況を理解して、要約、翻訳、音声対話、音声合成を利用して、人にわかりやすく伝える。

 これにより、例えばカメラに写った人に合わせて情報を提示する案内システムや、音声記録をテキスト化して重要な発言だけをチームで共有するなど、幅広い業務や用途で活用できるようになるという。

 第一弾として、音訳エディタと音声書き起こしエディタのサービスの10月開始に向け、自治体・図書館向け音訳支援サービス、金融業向け対話サービス、フィールド作業支援などへ提案していく。

 さらに、音声認識技術で音声データをテキスト化する「音声ビューア」、ウェブブラウザー上で手軽に合成音声を作成し編集できる「音声クリエータ」(日本語以外に、米語、中国語、韓国語など11言語に対応)、用途に応じて構築された対話知識に基づき、曖昧な問いかけにも応える「音声対話」、話す先から逐次訳せる「同時通訳」(日英・英日、日中・中日に対応)、客層や混雑度などの状況把握や登録した人物を検出する「人物ファインダ」などの機能を今後提供する予定。

 また、さらなる次世代サービスに向け、「感情付き似声生成技術」や「情景文字認識技術」なども研究・開発しているという。(記事:阪木朱玲・記事一覧を見る

関連記事