パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発
配信日時: 2025-11-27 16:20:00
[画像: https://prcdn.freetls.fastly.net/release_image/3442/6511/3442-6511-5c8d6a4e984584ac439831f6367412d4-1600x800.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)およびパナソニック ホールディングス株式会社(以下、パナソニックHD)は、UCLAの研究者らと共同で、拡散モデルを用いたマルチモーダルAI(※)「LaViDa」を開発しました。
近年、マルチモーダルAIは大規模言語モデルの成功を取り入れたモデル大規模化により性能を高めてきましたが、従来の自己回帰型による文章生成では文章量が増えるにつれ、生成時間が増加することが課題でした。今回開発したLaViDaでは、文章の生成を拡散モデルで行うことで生成のスピードを可変にすることが可能になり、既存の自己回帰型手法と同等精度で約2倍の高速化を達成しました。
本技術は、先進性が国際的に認められ、AI・MLのトップカンファレンスであるNeurIPS 2025に採択されました。2025年12月3日から2025年12月5日までアメリカ、サンディエゴで開催される本会議で発表します。
■今後の展望
今回開発したLaViDaは拡散モデルを用いて文章生成を行うマルチモーダルAIです。現在、パナソニックグループでは全社的な業務効率化・自動化を目的としたAIエージェントの導入を進めていますが、各現場に存在する様々な形式のドキュメントや資料は必ずしもAIエージェントにとって理解しやすいものではありません。本手法を用いて統一されたフォーマットに整形することでAIエージェントの導入を加速したいと考えています。
今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進します。
※画像、テキストなど複数の種類の情報を同時に扱えるAIのことを指す
全文は以下プレスリリースをご覧ください。
▼[プレスリリース]パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発(2025年11月27日)
https://news.panasonic.com/jp/press/jn251127-2
<関連情報>
・arXiv
https://arxiv.org/abs/2505.16839
・Panasonic×AI ウェブサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI X
https://x.com/panasonic_ai
PR TIMESプレスリリース詳細へ
スポンサードリンク
「パナソニックグループ」のプレスリリース
- 欧州で生成AIデータセンター向け液冷システム事業を開始03/05 09:20
- 中国・広州の多層基板材料「MEGTRON」新ラインに約75億円、AIサーバ需要増でグローバル生産体制強化を加速03/04 13:20
- 人とロボットが共棲する日常に向けたNICOBOのテクノロジー進化03/04 11:50
- 「パナソニックグループ」のプレスリリースをもっと読む
スポンサードリンク
最新のプレスリリース
- フードオロジー 日本限定フレーバー「メロン」「ブルーベリー」を発売03/05 13:00
- 建築CPD認定プログラム「風揺れ対策を解決する高層ビル用大型AMDの技術」無料ウェビナーを4月2日(木)に開催03/05 13:00
- ブルボン、ザクッと食感のスティックシリアル「レザール」を3月10日(火)に新発売!03/05 13:00
- 「第32回アクター賞(旧:SAG賞)」にデミ・ムーアがハリー・ウィンストンのジュエリーを着用し登場03/05 12:45
- ZERO FES 2026 追加アーティスト発表!米ビルボード席巻の17歳新世代ラッパー「BabyChiefDoit(ベイビーチーフドゥーイット)」の来日出演が決定!03/05 12:45
- 最新のプレスリリースをもっと見る
