Asayomu Tech
注目huggingface_papers2

StreamMA:マルチエージェント推論のストリーミング通信で平均+7.3pp改善

要約

マルチエージェント推論システムは従来、全推論チェーン生成後に次エージェントへ渡す方式で、遅延がパイプライン深度に比例して増大する課題があった。新手法「StreamMA」は各推論ステップを生成と同時に下流エージェントへ送信し、遅延を削減する。さらに推論の初期ステップは後期より信頼性が高いため、エラーが混入しやすい後期ステップを除いた伝達が精度向上にも寄与する。数学・科学・コードの8ベンチマークでClaudeおよびGPT-5.4を用いた検証で平均+7.3pp、最大+22.4ppの性能向上を確認。エージェントあたりのステップ数増加が効率・精度を同時に高める「ステップレベルスケーリング則」も発見された。

あなたへの影響

マルチエージェントLLMパイプラインの設計に携わるチームにとって、レイテンシと精度を同時改善できる実践的なアーキテクチャ知見として注目に値する。

推奨:次のスプリントで自社パイプラインへの適用可能性を評価することを推奨する。

詳細を読む → 元記事へ※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

※ 外部記事の権利は原著作者に帰属します。著作権削除要請は copyright@asayomu.jp までご連絡ください(受領確認 24h・実処理 72h 以内)。