Asayomu Tech
注目huggingface_papers2

HarnessX:AIエージェント実行ハーネスを自動進化させるフレームワーク、平均+14.5%改善

30秒で把握

  • 1HarnessXがエージェントハーネスを自動進化・5ベンチマークで平均+14.5%向上
  • 2AEGIS(トレース駆動多エージェント進化エンジン)で最大+44.0%改善を達成
  • 3モデルスケーリング不要・実行時インターフェース進化が性能向上の補完手段として有効

要約

HarnessXは、AIエージェントの実行環境(プロンプト・ツール・メモリ・制御フロー)を構成可能・適応的・自律進化可能にするフレームワークとして発表された。型付きハーネス原始要素を代入代数で組み合わせ、トレースデータ駆動の多エージェント進化エンジン「AEGIS」で最適化する仕組みを持つ。ALFWorld・GAIA・WebShop・tau³-Bench・SWE-bench Verifiedの5ベンチマークで平均+14.5%(最大+44.0%)の性能向上を達成し、ベースラインが低いタスクほど改善幅が大きかった。これはエージェントの性能向上がモデルのスケーリングだけに依存しない実行時インターフェースの進化が有効な補完手段であることを示す。コードは今後オープンソース化予定。

あなたへの影響

AIエージェント基盤を構築・運用しているチームは、モデル更新のたびにスキャフォールディングを手作りし直すコストを削減できる可能性があるため、HarnessXのアーキテクチャ設計(代入代数+トレース駆動進化)を自社パイプラインの設計参考として評価する価値がある。

推奨:コードが公開された段階で、既存のLangChainやLangGraphベースの構成と比較検証を行うのが現実的な次のステップ。

詳細を読む → 元記事へ※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

※ 外部記事の権利は原著作者に帰属します。著作権削除要請は copyright@asayomu.jp までご連絡ください(受領確認 24h・実処理 72h 以内)。