パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発
配信日時: 2025-11-27 16:20:00
[画像: https://prcdn.freetls.fastly.net/release_image/3442/6511/3442-6511-5c8d6a4e984584ac439831f6367412d4-1600x800.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)およびパナソニック ホールディングス株式会社(以下、パナソニックHD)は、UCLAの研究者らと共同で、拡散モデルを用いたマルチモーダルAI(※)「LaViDa」を開発しました。
近年、マルチモーダルAIは大規模言語モデルの成功を取り入れたモデル大規模化により性能を高めてきましたが、従来の自己回帰型による文章生成では文章量が増えるにつれ、生成時間が増加することが課題でした。今回開発したLaViDaでは、文章の生成を拡散モデルで行うことで生成のスピードを可変にすることが可能になり、既存の自己回帰型手法と同等精度で約2倍の高速化を達成しました。
本技術は、先進性が国際的に認められ、AI・MLのトップカンファレンスであるNeurIPS 2025に採択されました。2025年12月3日から2025年12月5日までアメリカ、サンディエゴで開催される本会議で発表します。
■今後の展望
今回開発したLaViDaは拡散モデルを用いて文章生成を行うマルチモーダルAIです。現在、パナソニックグループでは全社的な業務効率化・自動化を目的としたAIエージェントの導入を進めていますが、各現場に存在する様々な形式のドキュメントや資料は必ずしもAIエージェントにとって理解しやすいものではありません。本手法を用いて統一されたフォーマットに整形することでAIエージェントの導入を加速したいと考えています。
今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進します。
※画像、テキストなど複数の種類の情報を同時に扱えるAIのことを指す
全文は以下プレスリリースをご覧ください。
▼[プレスリリース]パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発(2025年11月27日)
https://news.panasonic.com/jp/press/jn251127-2
<関連情報>
・arXiv
https://arxiv.org/abs/2505.16839
・Panasonic×AI ウェブサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI X
https://x.com/panasonic_ai
PR TIMESプレスリリース詳細へ
スポンサードリンク
「パナソニックグループ」のプレスリリース
スポンサードリンク
最新のプレスリリース
- 世界中で大反響! 韓国では12万部超&「21世紀の名作50冊」にも選出! 「すべてが美しい小説」と話題、松家仁之さん著『火山のふもとで』11/27 19:45
- 【北海道/苫小牧】冬旅が今だけ最大28%OFF★11/28ブラックフライデー最終日になごみのご予約を!11/27 19:45
- 多機能ロッカー「マルチエキューブ」九州初導入!12 月3 日(水)博多駅に設置します!~一台4役!通常の預入に加え、ロッカー事前予約・受取・発送機能を搭載!~11/27 19:45
- 9mm Parabellum Bullet、12月2日(火)19時30分からYouTube配信「カオスの百年」vol.41を生配信!11/27 19:45
- 馬に関するモノやコトを一同に集めた日本最大級の馬の祭典!「第7回ホースメッセ TOKYO2026」11/27 19:45
- 最新のプレスリリースをもっと見る
