注目★★★★★Hugging Face Papers2026年6月30日

35B モデルで 1 兆パラメータ級性能を実現——エージェント能力を横展開するスケーリング法

30秒で把握

1Agents-A1（35B MoE）が長ホライゾン能力拡張で 1 兆パラメータ級性能を達成、Kimi-K2.6 や DeepSeek-V4-pro を複数ベンチマークで上回る
2平均 45K トークン軌跡生成インフラと領域別教師モデル＋マルチ教師蒸留により 6 領域を統一モデル化、知識転移効率を向上
3SEAL-0（56.4）・IFBench（80.6）・FrontierScience-Olympiad（79.0）で競合 1T モデルを超過、小規模モデルでのエージェント能力スケーリングが実用可能と実証

要約

Hugging Face のチームが Agents-A1 という 35B のミクスチャー・オブ・エキスパート型エージェントモデルを開発し、パラメータ数ではなくエージェント能力の幅を拡張することで 1 兆パラメータ級の性能を達成した。平均 45K トークンの長ホライゾン軌跡データを生成するインフラを構築し、全領域教師モデルの学習、領域別特化教師による知識抽出、マルチ教師のドメインルーティング蒸留により 6 つの異なる領域を統一したモデルに統合した。SEAL-0 で 56.4、IFBench で 80.6、FrontierScience-Olympiad で 79.0 など複数ベンチマークで Kimi-K2.6・DeepSeek-V4-pro などの 1T モデルを上回り、長ホライゾンタスクで広範な性能を実証した。

あなたへの影響

この記事が日本のエンジニアに与える影響と、今日取るべきアクションは、Personal会員向けに掲載しています。

7日間無料で読む

クレカ不要・いつでも解約

詳細を読む → 元記事へ

X で共有

※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

35B モデルで 1 兆パラメータ級性能を実現——エージェント能力を横展開するスケーリング法

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開 言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model