FastLabel、NABLAS株式会社へ大規模視覚言語モデル開発に必要な独自データを作成し提供
配信日時: 2025-04-14 11:00:00
日本の食品・流通小売業界に特化した生成AIモデルにおけるGENIAC第2期の採択を支援
Data-centric AI[※1]開発に必要なデータ収集・生成からアノテーション、モデル開発、DataOps構築までの全工程を支援するFastLabel株式会社(本社:東京都新宿区、代表取締役CEO:鈴木健史、以下「当社」)は、AI総合研究所として活動するNABLAS株式会社 (本社 : 東京都文京区本郷、 代表取締役 所長 : 中山浩太郎、 以下「NABLAS」)へ、大規模視覚言語モデル開発に必要な独自のInstruction Tuningデータ[※2]を作成し提供したことをお知らせします。
[※1] Data-centric AI:AIのデータセットを改善することでモデルの精度改善を実現するアプローチ
[※2] Instruction Tuningデータ:AIモデルに指示と回答のデータセットを学習させる技術におけるデータ
[画像1: https://prcdn.freetls.fastly.net/release_image/65427/176/65427-176-d284a297ddb407d013bbe8ad1cc9eb64-1774x248.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
今回の当社のデータ作成と提供は、NABLASによる日本の食品・流通小売業界への推進を見据えた大規模視覚言語モデル開発に活用され、経済産業省・NEDOが推進する国内生成AI開発プロジェクト(以下、GENIAC)[※3]」の第2期(2024年10月発表[※4])の採択も支援しています。
[※3]GENIAC: 経済産業省が2024年2月に立ち上げた国内の生成AI開発力強化プロジェクト
[※4]NABLASの発表:https://www.nablas.com/post/geniac-20241011
【日本の生成AIモデル開発におけるデータの課題】
日本の生成AIモデル開発におけるデータは量と質において以下の課題があります。
量の課題:日本語は英語に比べて主要なサイトなどにおけるインターネット上の公開データが少なく、大規模な学習データを確保しにくいといった背景があります。
質の課題:日本語データの多くはニュース記事やWikipediaなどに偏りがちで、カジュアルな口語表現や、最新の流行語、ネットスラング、SNSの会話データなどの情報が不足しています。
【当社の支援内容】
課題を踏まえ、今回当社ではNABLASへ以下の支援を行いました。
Instruction Tuningデータ作成:日本国内で流行した食品の情報をSNSから収集するために収集データの要件を整理し、要件をもとに大規模データをSNSより収集した上で指示文と回答文を作成。
GENIAC要件への対応と採択支援コンサルティング:GENIACにおける当社の豊富な採択支援実績に基づいたコンサルティングを提供し、審査基準を満たす生成AIモデル開発の企画を支援。
[画像2: https://prcdn.freetls.fastly.net/release_image/65427/176/65427-176-f52eed410cc2b72e17670a34f27e5923-3900x2600.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
【NABLAS R&D事業部 リード・リサーチエンジニア 新立様より本支援に関する所感】この度は、「流行食」に特化した大規模モデル開発プロジェクトにおけるデータセット作成を依頼しました。多岐にわたるユニークなタスク設定をしていたのでデータのアノテーションにおける精度に課題がありましたが、綿密な打ち合わせによる課題感のすり合わせとアノテーション例の複数回の確認により、こちらの想定していた通りの高品質なデータセットを作成することができて助かりました。今後はこのデータセットを用いて作成した大規模モデルをもとに、「食x生成AI」という新規性の高いサービスの展開を進めていきます。
【今後の展望】
当社は、創業以来、AI開発におけるデータに関するあらゆる課題を解決するソリューションを提供しています。「AIインフラを創造し日本を再び世界レベルへ」というパーパスを掲げ、昨今急速に加速する生成AIの技術革新の流れの中、モデル開発におけるデータ構築の領域でエンタープライズ企業様を中心に下支えして参りました。今回のNABLASへの支援は、生成AI領域におけるパーパス実現に向けた重要な一歩であり、日本国内外で持続可能な社会インフラとしての生成AI技術の開発及び定着を下支えすることを引き続き目指してまいります。
【当社事業について】
当社は「データセット提供」、「アノテーション代行」、「モデル開発支援」、「FastLabel Data Factory」など、AI開発を行うお客様に向けたトータルソリューションを提供しています。
データセット提供:権利クリアかつ高品質な各種データの収集、販売を行います。ストックの提供や新規撮り下ろしにも対応しています。
アノテーション代行:あらゆる非構造化データに対応し、弊社独自の品質管理によりデリバリー品質を担保しています。ドメイン知識が必要な仕様にも対応可能です。
モデル開発支援:画像や動画の撮影条件や正確性/統一性を読み解きながらモデルの学習・評価を実施し、評価結果を精度向上につなげていきます。
FastLabel Data Factory:データ収集・管理、アノテーション、モデル開発までワンストップで提供するSaaSです。DataOps構築を実現し教師データ準備を大幅に効率化できます。
当社は各業界リーディング企業への豊富な支援実績を有し、権利クリアかつ高品質なデータ作成に強みを置いております。豊富な経験を通して培ったアノテーション仕様作成をはじめとしたAI開発のノウハウで、今後も多くのお客様を支援してまいります。
【当社の概要について】
社名:FastLabel株式会社
代表者:代表取締役CEO 鈴木健史
事業内容:Data-centric AI開発を支援するプロフェッショナルサービスとプロダクトの提供
設立:2020年1月23日
本社所在地:〒163-0224 東京都新宿区西新宿2-6-1 新宿住友ビル24階
URL:https://fastlabel.ai/
PR TIMESプレスリリース詳細へ
スポンサードリンク
「FastLabel」のプレスリリース
- W&B Japanが主催する「Physical AIの開発のエコシステムから事例まで一気に学ぶ会」にてAIロボティクス開発におけるデータ収集の課題やプロジェクト事例などをテーマに登壇04/10 14:00
- FastLabelとRealMan RoboticsがフィジカルAIにおけるグローバル戦略協定を締結 ~世界水準のロボットトレーニングデータの提供によりVLAモデル開発を支援~04/03 14:00
- FastLabel、国内外のお客様に向けてフィジカルAI事業を本格展開 ~新たな組織としてロボティクスAI事業本部を発足し、コンサルティング・技術開発体制を強化~04/01 16:00
- 「FastLabel」のプレスリリースをもっと読む
スポンサードリンク
最新のプレスリリース
- Offo tokyo初のデジタルアルバムを6月17日にリリース新曲「Deja-vu」を6月3日に先行配信05/09 20:00
- 【アートイベント】「アート」×「謎解き」イベント、5/14より池袋にて開催!『怪盗ニャンポ -幻想のとろける美術館-』20組のアーティストたちが作品を制作、テーマは「シュルレアリスム」05/09 16:48
- 【開催中】一旗プロデュース「動き出す妖怪展 TOKYO」来場者数が5万人を突破し記念セレモニーを実施。日本が誇る妖怪美術と立体映像・立体造形で大人から子どもまで楽しめるイマーシブアートミュージアム。05/09 16:45
- プロテニスプレーヤー・園田彩乃選手による特別クリニックイベントを開催|テニスガーデン広陵 25周年記念05/09 16:45
- 来場者数5万人を突破!好評開催中『動き出す妖怪展 TOKYO』05/09 16:45
- 最新のプレスリリースをもっと見る
