注目★★★★★Hacker News
次世代列指向フォーマットF3、Wasm埋め込みでParquetの限界を突破
30秒で把握
- 1F3がParquet/ORC超えを目指す次世代列指向フォーマットとして論文発表
- 2Wasmデコーダをファイルに埋め込み(数KB)、プラットフォーム非依存の互換性を実現
- 3現在はリサーチPoC段階・本番利用不可、論文(SIGMOD 2025)で評価結果を確認
要約
研究チーム(Zeng et al.)はParquetやORCの設計上の欠点を克服する次世代オープンソースデータファイルフォーマット「F3(Future-proof File Format)」を発表した。F3の最大の特徴は、Wasmバイナリをファイル自体に埋め込むことで、ネイティブデコーダが存在しないプラットフォームでも互換性を保つ設計だ。埋め込みサイズはキロバイト単位で抑えられており、開発者が新しいエンコーディング方式を容易に追加できる汎用APIも提供する。評価実験ではF3のストレージレイアウトの有効性とWasm駆動デコードの利点を既存フォーマットと比較して確認した。現時点では研究プロトタイプ(MIT ライセンス)であり、本番環境での使用は非推奨とされている。
あなたへの影響
データ基盤にParquetやORCを採用しているチームは、F3の設計思想(Wasm内蔵による将来互換)を把握しておくと、次世代ETLやクエリエンジン選定の議論に役立てられる。
推奨:ただし現在はDebian 12上でのPoC検証段階のため、採用検討は論文(VLDB 2025・DOI: 10.1145/3749163)での評価結果を精査してからになる。