WAN多人运动迁移控制-VACE+Phantom融合模型生成视频
VACE是阿里巴巴开源的视频生成与编辑统一模型 ,整合了文生视频、图生视频、视频重绘、背景延展等能力,支持多任务自由组合。
Phantom 是字节跳动推出的统一视频生成框架,主要用于生成一致性主体视频,支持单主体和多主体场景。其核心是通过跨模态对齐技术实现文本、图像与视频之间的语义对应关系,确保视频中主体特征(如外观、动作)与参考素材保持一致。
WAN多人运动迁移控制-VACE+Phantom融合模型生成视频
VACE是阿里巴巴开源的视频生成与编辑统一模型 ,整合了文生视频、图生视频、视频重绘、背景延展等能力,支持多任务自由组合。
Phantom 是字节跳动推出的统一视频生成框架,主要用于生成一致性主体视频,支持单主体和多主体场景。其核心是通过跨模态对齐技术实现文本、图像与视频之间的语义对应关系,确保视频中主体特征(如外观、动作)与参考素材保持一致。