数学特化の大規模言語モデル「WizardMath」
2023年8月30日 09:15
米Microsoftと中国科学院の研究者が「WizardMath」という大規模な数学特化の言語モデルを開発した(論文、ITmedia)。このモデルは、数学的な推論能力を向上させることを目指している。このモデルは、オープンソースの事前学習済み大規模言語モデル(LLM)である「Llama-2」に対して適用することで実現する。Llamaモデルシリーズはオープンソースの大規模言語モデルで、クローズドソースのモデルとの差を縮める役割を果たしているが、数学や科学のような多段階の推論が求められる場面には課題があったとされる。 研究ではこの問題点に着目し、Llama-2の数学的推論能力を向上させる手法「WizardMath」を提案。「Reinforcement Learning from Evol-Instruct Feedback」(RLEIF)という新しい手法を用いてLlama-2の数学的推論能力を向上させたという。実験の結果、WizardMathは数学的推論ベンチマークであるGSM8kとMATHにおいて、他のオープンソースの言語モデルを大きく上回る性能を示したそうだ。具体的には、GSM8kでは+24.8、MATHでは+9.2の向上が見られたとのこと。また、OpenAIのChatGPT-3.5やAnthropicのClaude Instant-1、GoogleのPaLM-2などのモデルに比べても、特にGSM8kの成績においてはWizardMathは優れた性能を発揮していたとしている。 Kuritsukasa 曰く、 AGIに近づいているかと思われていたAI開発だけど、ここに来て数学特化型のLLMが登場
関連記事
最新記事
- NVIDIAら、実機ロボットの研究開発を完全自動化するフレームワーク「ENPIRE」発表―AIが検証からコード修正まで実行
- Z.aiが「GLM-5.2」のオープンウェイトを公開、性能はClaude Opusに迫るもAPI経由のデータ送信に中国法上のリスク指摘
- 【内部リーク】Metaが数千人の技術者をAI訓練用のデータ作成に投入、社内からは「強制収容所」と自虐する不満が噴出
- 『R-Type Tactics I・II Cosmos』が6プラットフォームで海外発売へ―幻のPSP続編が16年越しに初の英語化
- ChatGPTのシェアが初の50%割れ、GeminiとClaudeが猛追――Sensor Tower調査