Asayomu Tech
注目huggingface_papers1

ThoughtFold: LRMの推論トークンを56%削減する新フレームワーク

要約

大規模推論モデル(LRM)はCoTの過剰な試行錯誤を学習してしまう「過剰思考」問題を抱えている。ThoughtFoldは、各正解軌跡内の冗長性を内省的に特定し、候補サブ軌跡のスペクトラムを生成する手法だ。マスク付き選好最適化により冗長な探索をペナルティとし、必要な推論ステップ同士を直結させる。実験ではDeepSeek-R1-Distill-Qwen-7Bのトークン使用量を約56%削減しつつ、精度は最先端水準を維持した。

あなたへの影響

推論コスト削減は本番運用コストに直結するため、LRMを活用するチームにとって注目度の高い研究成果だ。

推奨:次スプリントで自社タスクへの適用可能性を評価しておきたい。

詳細を読む → 元記事へ※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

※ 外部記事の権利は原著作者に帰属します。著作権削除要請は copyright@asayomu.jp までご連絡ください(受領確認 24h・実処理 72h 以内)。