注目★★★★★Hugging Face Papers2026年7月2日

進化的探索の経験を学ぶ LLM、371 タスクで汎化——Evolution Fine-Tuning

30秒で把握

1LLM が 371 最適化タスクの探索軌跡 (156K 件) から進化戦略を学習、保持外タスクで平均 10.22% 向上
2モデル自体が「変異・バックトラック判断」を習得しタスク間で再利用可能に、従来の毎回スクラッチ方式から脱却
32B～9B LLM で検証・test-time RL 併用で SOTA 性能に合致、多ドメイン最適化への応用準備整備

要約

研究チームは Evolution Fine-Tuning (EFT) を提案し、LLM が進化的探索の経験を複数のタスク間で再利用できることを示した。10 ドメイン・371 最適化タスクから 156K 個の探索軌跡を収集した Finch Collection データセットで 2B～9B パラメータの LLM を fine-tune した結果、保持外タスク 22 個で平均 10.22% の精度向上を達成した。従来は各タスクで探索スキャフォルドから新たに始めていたが、EFT により「どこをどう変異させるか」「バックトラックのタイミング」といった進化戦略をモデル自体に内在化させることで、新タスクへの迅速な適応が可能になった。

あなたへの影響

この記事が日本のエンジニアに与える影響と、今日取るべきアクションは、Personal会員向けに掲載しています。

7日間無料で読む

クレカ不要・いつでも解約

詳細を読む → 元記事へ

X で共有

※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

進化的探索の経験を学ぶ LLM、371 タスクで汎化——Evolution Fine-Tuning

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開 言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model