
Wan Fun:阿里巴巴具備強化幀控制的進階 AI 影片生成
Alibaba 推出 Wan Fun,這是在 AI 影片生成技術方面的一項突破性進展,它顯著地提升了影片創作和控制能力。 Wan Fun 的發布引入了兩個主要的模型變體:Wan2.1-Fun-InP 和 Wan2.1-Fun-Control,每個版本都有 1.3B 和 14B 參數版本,標誌著 AI 影片生成領域的一次重大飛躍。
革命性的功能和能力
Wan Fun 模型套件代表了影片生成技術的重大演進,在 AI 生成的影片中提供了前所未有的控制和品質。 Wan Fun 的 Wan2.1-Fun-InP 模型,採用多解析度能力訓練,擅長於文字轉影片生成,具有卓越的首幀和尾幀預測準確性。 這項 Wan Fun 的進展解決了影片生成中最具挑戰性的問題之一:保持起始幀和結束幀之間的一致性,同時確保整個序列的平滑過渡。
Wan Fun Control 模型引入了一套全面的控制機制,可以精確地操縱影片生成。 Wan Fun 支援多種控制條件,包括 Canny 邊緣、深度資訊、姿勢估計和 MLSD (Multi-Level Structural Descriptor,多層結構描述符),使創作者能夠對生成的內容進行細粒度的控制。 此外,Wan Fun 還整合了軌跡控制,從而可以更精確地引導生成影片中的運動和移動。
技術規格和能力
Wan Fun 的兩個變體都展示了令人印象深刻的技術規格:
- 解析度靈活性:支援多種解析度輸出 (512x512、768x768 和 1024x1024)
- 幀生成:能夠以每秒 16 幀的速度生成 81 幀
- 多語言支援:內建處理多種語言提示的能力
- 先進的控制系統:與各種控制機制整合,實現精確的影片操作
- 雙模型尺寸:提供 1.3B 和 14B 參數版本,為不同的計算需求提供靈活性
應用和使用案例
Wan Fun 的多功能性使其適用於廣泛的應用。 Wan Fun 生態系統支援:
-
使用 Wan Fun 進行創意內容製作
- 使用 Wan Fun 先進的生成功能製作短片
- 通過 Wan Fun 的控制機制生成藝術影片
- 使用精確的 Wan Fun 控制來製作動態圖形和動畫
-
專業影片製作
- 故事板可視化
- 特效預覽
- 概念開發
-
教育內容
- 教學影片
- 教育動畫
- 可視化解釋
模型架構和實作
Wan Fun 架構建立在先前的影片生成模型之上,同時引入了幾個關鍵創新:
- 增強的幀預測:通過先進的訓練方法,提高了首幀和尾幀的一致性
- 多解析度訓練:複雜的訓練方法,能夠在各種解析度下實現高品質輸出
- 控制整合:無縫整合多種控制機制,實現精確的影片操作
- 高效處理:優化的架構,可實現更好的資源利用和更快的生成時間
技術要求和部署
該模型可以部署在各種環境中,建議的規格包括:
- CUDA 11.8 或 12.1
- CUDNN 8+
- Python 3.10 或 3.11
- PyTorch 2.2.0
- 至少 60GB 的可用磁碟空間
- 與各種 GPU 配置相容 (在 NVIDIA 3060、3090、V100、A10 和 A100 上測試)
未來影響
Wan Fun 的發布代表了 AI 影片生成技術的一個重要里程碑。 它在幀預測和控制機制方面的先進能力,為 AI 生成的影片內容設定了新的標準。 該技術的潛在應用範圍跨越多個行業,從娛樂和教育到專業影片製作和創意藝術。
可訪問性和實施
Wan Fun 可通過多個平台使用:
- 在 Hugging Face 上的官方分發
- 與 ModelScope 平台的整合
- 隨時可用的 Docker 容器
- 靈活的本地安裝選項
Wan Fun 模型的靈活部署選項和全面的文檔使其易於 AI 影片生成領域的研究人員和從業者使用。
結論
Wan Fun 代表了 AI 影片生成技術的重大進步,在生成的內容中提供了前所未有的控制和品質。 Wan Fun 的雙模型方法,結合了增強的幀預測和複雜的控制機制,為各種影片生成應用提供了一個強大的工具。 隨著 Wan Fun 技術的不斷發展,它證明了 AI 生成的影片內容的快速發展,為該領域的品質和控制設定了新的基準。
連結
KJ 的 Wan2.1 影片工作流程
- Wan2.1-Fun-14B-InP: https://huggingface.co/alibaba-pai/Wan2.1-Fun-14B-InP
- ComfyUI-WanVideoWrapper: https://github.com/kijai/ComfyUI-WanVideoWrapper
- Wan2.1-Fun-InP-14B_fp8_e4m3fn.safetensors: 下載模型並放置在 /ComfyUI/models/unet 目錄下。連結:https://huggingface.co/Kijai/WanVideo_comfy/tree/main