注目★★★★★Hacker News
Mistral がLeanstral 1.5 公開、6B パラメータで数学証明を自動化・未知のバグ 5 件発見
30秒で把握
- 1Mistral Leanstral 1.5 公開・6B パラメータで数学証明 587/672 問解く・FATE-H 87% 達成
- 2未報告バグ 5 件自動発見・Seed-Prover 1.5 比 75 倍のコスト削減・Rust コード形式検証に対応
- 3Apache-2.0 オープンソース・Hugging Face と無料 API で即利用可能・Lean 4 エコシステムで実装開始
要約
Mistral は形式検証向け言語モデル Leanstral 1.5 を Apache-2.0 ライセンスで公開した。6B アクティブパラメータながら miniF2F を 100% 飽和、PutnamBench で 587/672 問を解き、FATE-H で 87%・FATE-X で 34% の最高性能を達成した。中段階学習・教師あり微調整・CISPO 強化学習の 3 段階で訓練され、実コード検証で 57 リポジトリから未報告のバグ 5 件を自動発見、Seed-Prover 1.5 比約 $300/問から $4/問へ推論コストを削減した。Hugging Face と無料 API で即座に利用可能。
あなたへの影響
この記事が日本のエンジニアに与える影響と、今日取るべきアクションは、Personal会員向けに掲載しています。
クレカ不要・いつでも解約