コーネル大学の研究チームは、LLMの世界状態維持と次トークン予測の処理を分離する「デュアルストリーム」設計を提案し、標準的なモデルに比べ2〜3%の効率向上を実証した。
07/04 23:44
再公開されたClaude Fable 5のデバッグスコアが70%急落。モデルの劣化ではなく、新安全分類器がコーディング要求の多くを検知し、下位モデルのOpus 4.8へ自動迂回させているためと報じられた。
07/04 23:44
Google ドライブのモバイルアプリに、自然言語で保存文書を検索・要約できる対話型AI機能「Ask Gemini」と「AI Overviews」が導入され、有料Workspace会員向けに順次提供が開始された。
07/04 07:26
Googleが発表した「Android Halo」は、AIエージェントを専用コンテナに隔離して実行するAndroid 17の新機能。他のアプリへのアクセスを防ぎつつ、ステータスバーから進捗確認や操作が可能になる。
07/04 07:26
GitHub Copilotに中国Moonshot AIの「Kimi K2.7 Code」が追加。MoE採用で低コストかつ高性能とされるが、中国国家情報法に伴う企業リスクや、ベンダー発表値のみのベンチマークに懸念も残る。
07/04 07:26
GoogleはNotebookLMに、アップロード資料を約60秒の縦型動画に自動要約する新機能を追加した。新画像生成モデル「Nano Banana 2 Lite」を採用し、まずは有料プラン向けに英語で提供される。
07/04 07:26
CloudflareはAIクローラーを3カテゴリに分類して制御する新機能を公開し、AIエージェントへの直接課金を可能にするゲートウェイのウェイティングリストを開始した。9月15日にはデフォルト設定が変更される予定。
07/04 07:15
金融機関の52%が自律型AIを導入する中、英中銀はAIの同時暴走を防ぐため、市場全体の取引を強制停止する「キルスイッチ」などの新安全策の検討を開始した。
07/04 07:15
ファーウェイ系コミュニティがAI記憶フレームワーク「JiuwenMemory」を公開。非同期の記憶統合など先進的な機能を備える一方、中国国家情報法に伴うデータリスクが懸念されている。
07/04 07:15
AI旅行エージェントが予約確定に失敗する技術的課題に対し、Travelportなどの旅行インフラ大手が、対話型AIと決定論的APIを分離した「2層アーキテクチャ」による解決策の商用テストを開始した。
07/04 00:19
Z.aiの次期モデル「GLM-5.3」に対し、開発者コミュニティから画像認識(ビジョン)機能の搭載を求める声が殺到しており、オープンウェイトモデルでのマルチモーダル化への期待が高まっている。
07/04 00:19
清華大学らが発表した「CausalMix」は、因果推論を用いてLLMの学習データ混合比率を最適化する新手法であり、データプール変動時に従来手法が破綻する課題を解決し、再学習コストを大幅に削減する。
07/04 00:19
OpenAIが公開したゲノム解析ベンチマークで最先端AIの正解率が3割未満にとどまり、データ異常を認識しても正しい分析手法を選択できない「気づきと行動のギャップ」という課題が浮き彫りになった。
07/03 23:12
AnthropicがUCバークレーのジェラニ・ネルソン教授を招聘し、AI人材競争はモデル構築から「数学的・理論的限界の解明」という新局面へ移行しつつある。
07/03 23:11
Microsoft Azure上でAnthropicの「Claude」が一般提供開始となり、既存のAzure契約やクレジットでの利用が可能になった。
07/03 23:09
OpenAIの論文から未発表の「GPT-5.6 Pro」3モデルの存在が判明。月額200ドルのChatGPT Proが、速度や推論力に応じて最適化された複数モデルを選択する構造へ移行する可能性が浮上している。
07/03 22:39
Googleが自律型AI「Gemini Spark」のMac版ベータを公開。ローカルファイル操作やオープン規格「MCP」に対応し、競合のデスクトップAIエージェントに対抗する。
07/03 22:39
LM Arenaに未発表のGemini Flashチェックポイントが登場。現行の3.5 Flashを上回る性能とされ、Gemini 4か3.6の先行テストとみられる。Proモデル遅延のなか、動向が注目される。
07/03 22:38
AppleがSafari Technology PreviewにAIエージェント用の「MCPサーバー」をネイティブ搭載。17のツールにより、AIがローカル環境で自律的にWebデバッグや検証を行えるようになった。
07/03 16:38
AnthropicがClaude Codeの「Dynamic Workflows」を一般公開。最大1000個の並列エージェントを協調させ、コンテキスト制限を回避する新アーキテクチャを採用し、Proプランでも利用可能となった。
07/03 16:38
NVIDIAが再学習不要で推論速度を2.42倍に高速化する拡散言語モデル「Nemotron TwoTower」を公開。既存モデルにデノイザー塔を追加する2タワー構成で、品質を維持しつつコストを抑える。
07/03 16:38
米株式市場は6月、新型コロナウイルス禍からの回復期以来で最も好調な四半期を終えた。
07/02 21:42
AIコーディングエージェントが検証なしにパッケージを導入する隙を突き、ハルシネーションやプロンプトインジェクションを悪用したサプライチェーン攻撃が急増しており、CISAなども対策を呼びかけている。
07/02 21:20
Metaが余剰AIコンピューティング能力を外部に販売する計画を立てていると報じられ、CoreWeaveなどの競合ネオクラウドの株価が急落、AIインフラ市場の勢力図が大きく変わる可能性が出ている。
07/02 21:18
SKグループは2035年までにAIデータセンターと半導体供給網の拡大に総額約223兆円を投じる計画を表明し、データセンターを「知能工場」と位置づけてAI分野での主導権確保を狙う。
07/02 21:18
