注目huggingface_papers1分
MaxProof:IMO 2025で35/42達成、数学証明AIフレームワーク
30秒で把握
- 1MaxProof が IMO 2025 で 35/42・USAMO 2026 で 36/42 を達成し金メダル基準超え
- 2証明生成・検証・修正の 3 能力を M3 単一モデルに統合し低誤検知検証器を搭載
- 3テスト時に候補証明群をトーナメント選択で絞る集団レベルスケーリングを採用
要約
MiniMax は競技数学の証明に特化した推論フレームワーク「MaxProof」を発表した。M3 モデルは証明生成・証明検証・修正の3能力を単一モデルに統合し、テスト時に候補証明群をトーナメント選択で絞り込む集団レベルスケーリングを実現した。IMO 2025 で 35/42、USAMO 2026 で 36/42 を達成し、どちらも人間の金メダル基準を超えた。誤検知率を低く抑えた生成的検証器が精度の要となっている。
あなたへの影響
形式証明や数学推論の研究・実装に取り組むチームは。
推奨:証明生成・検証・修正を一体化したアーキテクチャが競技レベルで金メダル基準を超えた事実を踏まえ、自社の数学推論パイプラインへの応用可能性を次スプリントで評価することを推奨する。