Asayomu Tech
注目huggingface_papers1

Echo-Infinity:学習可能なメモリで無限長動画をリアルタイム生成

要約

Echo-Infinityは、任意の長さの動画をリアルタイムで生成するための自己回帰フレームワークだ。学習可能な「Memory Query」機構を導入し、過去フレームの情報を一定のコストで動的に圧縮・保持する。さらに「Unified Relative RoPE Recipe」によりRoPEの外挿問題を解消し、学習時と推論時の時間IDのギャップを埋めた。長短両方の動画生成タスクで最先端の性能を達成したと報告されている。

あなたへの影響

動画生成モデルの長期コンテキスト処理における計算コスト問題に対して、構造的なアプローチを提案した研究だ。

推奨:Video DiTsを応用するチームや長尺動画生成パイプラインを検討中の研究者は、次の評価サイクルで手法を確認しておく価値がある。

詳細を読む → 元記事へ※ 本文は元記事をご確認ください (asayomu は要約のみ提供)

※ 外部記事の権利は原著作者に帰属します。著作権削除要請は copyright@asayomu.jp までご連絡ください(受領確認 24h・実処理 72h 以内)。