Asayomu Tech
注目★★★★Hacker News

Mistral がLeanstral 1.5 公開、6B パラメータで数学証明を自動化・未知のバグ 5 件発見

30秒で把握

  • 1Mistral Leanstral 1.5 公開・6B パラメータで数学証明 587/672 問解く・FATE-H 87% 達成
  • 2未報告バグ 5 件自動発見・Seed-Prover 1.5 比 75 倍のコスト削減・Rust コード形式検証に対応
  • 3Apache-2.0 オープンソース・Hugging Face と無料 API で即利用可能・Lean 4 エコシステムで実装開始

要約

Mistral は形式検証向け言語モデル Leanstral 1.5 を Apache-2.0 ライセンスで公開した。6B アクティブパラメータながら miniF2F を 100% 飽和、PutnamBench で 587/672 問を解き、FATE-H で 87%・FATE-X で 34% の最高性能を達成した。中段階学習・教師あり微調整・CISPO 強化学習の 3 段階で訓練され、実コード検証で 57 リポジトリから未報告のバグ 5 件を自動発見、Seed-Prover 1.5 比約 $300/問から $4/問へ推論コストを削減した。Hugging Face と無料 API で即座に利用可能。

あなたへの影響

この記事が日本のエンジニアに与える影響と、今日取るべきアクションは、Personal会員向けに掲載しています。

7日間無料で読む

クレカ不要・いつでも解約

詳細を読む → 元記事へ※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

関連する記事

※ 外部記事の権利は原著作者に帰属します。著作権削除要請は copyright@asayomu.jp までご連絡ください(受領確認 24h・実処理 72h 以内)。