Wan2.2–S2V,阿里开源视频生成模型。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频,单次生成的视频时长可达分钟级。
数字人小剧场_双人对口型sparkTTS+sonic数字人
上一篇
2天前
wan2.2_14B_首尾帧图片生成视频
下一篇
1天前