一、前期准备:环境与基础依赖
制作ComfyUI数字人前,需要先完成基础环境搭建,满足最低硬件要求即可流畅运行。
- 硬件要求:显存≥6G的NVIDIA显卡(推荐8G以上),内存16G以上
- 软件基础:安装ComfyUI官方本体,确保能正常启动基础生图功能
- 必备依赖:安装FFmpeg(用于视频合成与音频封装)
必须安装的核心插件
- ComfyUI-VideoHelperSuite:视频加载、导出、帧处理必备
- ComfyUI-FacialRestore:面部修复,提升人脸清晰度
- Mimic Motion 相关节点:实现照片驱动面部动作
二、导入数字人专属工作流
从零搭建节点门槛极高,新手建议直接使用成品工作流,导入即可运行。
- 下载数字人工作流JSON文件
- 打开ComfyUI,点击右侧「Load」按钮,选择下载的JSON文件
- 等待节点加载完成,检查是否有缺失插件提示,按提示补装即可
三、核心参数设置与素材替换
工作流导入后,只需要替换3类素材,即可生成专属数字人视频。
1. 人物形象设置
上传一张正面、光线均匀的半身人像照片作为数字人基底,建议尺寸为512×768,避免复杂背景和遮挡。
2. 音频与口型驱动
导入准备好的语音音频文件(MP3/WAV格式),工作流会自动识别音频并匹配口型动作。也可以接入TTS节点直接生成语音。
3. 输出参数调整
- 视频时长:与音频时长自动匹配
- 分辨率:推荐720P,显存充足可选1080P
- 帧率:默认24帧,兼顾流畅度与生成速度
四、运行生成与导出
- 点击页面右上角「Queue Prompt」启动工作流
- 等待节点依次运行,首次生成时间较长,后续会逐步加快
- 生成完成后,在视频节点右键保存文件到本地即可
五、新手避坑提醒
- 人物照片尽量选择正面平视角度,侧脸会大幅降低口型同步准确率
- 音频尽量清晰无背景噪音,否则会出现口型错位
- 不要一次性开过高分辨率,先720P测试效果再逐步提升
欢迎加入 Typecho 大家族