注目★★★★★Hugging Face Papers2026年7月4日

曖昧な処理を軽量モデルに「プログラム化」、LLM API 不要の推論パラダイム

30秒で把握

1曖昧なプログラミング処理を自然言語から軽量ニューラルアダプタへコンパイル・Qwen3-0.6B が 32B と同等精度でメモリ 1/50
2推論を 30 tokens/s で MacBook M3 上で実行・オフライン動作で API コスト・遅延・依存度を排除
3FuzzyBench 10M 例で訓練した PAW コンパイラは関数定義時に 1 度だけ呼び出し・以後の呼び出しは極めて安価で高速化

要約

曖昧で規則化しにくいプログラミングタスク（ログの重要度判定、JSON 修復、検索結果ランキング等）を LLM API に頼る代わりに、自然言語仕様からコンパクトなニューラルアーティファクトへ直接コンパイルする「ファジー関数プログラミング」を提案した。Program-as-Weights（PAW）は 10M 例の FuzzyBench データセットで訓練した 4B パラメータのコンパイラが、凍結された 0.6B Qwen3 インタプリタ用のパラメータ効率的なアダプタを出力する。PAW は Qwen3-32B の直接プロンプティングと同等の精度を達成しながら、推論メモリを約 1/50 に削減し MacBook M3 上で毎秒 30 トークンで動作する。基盤モデルを入力ごとの問題解決器から再利用可能な小型アーティファクト生成の「工具製造機」へ位置づけ直し、関数定義時に 1 度だけ呼び出す仕組みで以後のコストとレイテンシを大幅削減した。

あなたへの影響

この記事が日本のエンジニアに与える影響と、今日取るべきアクションは、Personal会員向けに掲載しています。

7日間無料で読む

クレカ不要・いつでも解約

詳細を読む → 元記事へ

X で共有

※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

曖昧な処理を軽量モデルに「プログラム化」、LLM API 不要の推論パラダイム

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

30秒で把握

要約

あなたへの影響

関連する記事

ベスビオス火山で 1,900 年間封印された古代巻物、AI で初めて全文解読

NVIDIA、Cosmos 3公開 言語・映像・音声・行動を統合するWorld Model

LLM透かし技術、3〜5モデル平均で検出率50%以下に崩壊

NVIDIA、Cosmos 3公開言語・映像・音声・行動を統合するWorld Model