AI数字人制作工具SadTalker软件与教程

2023-11-05 19:40:40

这款AI一键让照片说话的模型叫SadTalker，是由西安交通大学的研究人员提出的，它可以让照片里的人物跟随音频的输入动起来，且头部运动、面部表情比较真实，下图是官方展示的效果图，还在等什么呢，即刻拥有它！

可以根据一张图片、一段音频，合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后，结合一段音频合成面部说话的视频。

1、启动软件

在下载下来的 SadTalker.zip 上点右键，选”解压到 SadTalker 文件夹”解压出来

打开解压出来的 SadTalker 文件夹，找到 WEBUI 运行.bat，打开它会弹出一个黑色窗口，稍等会，窗门里会出现 2行文字，如下图

把黑色窗口第一行那个网址 (就是http://127...1:7860这个) 复制一下只能选中后，按 Ctrl+C 复制，右键出不来菜单，然后粘贴Ctrl+v到浏览器地址栏里打开。

最好用谷歌浏览器，或微软 Edge浏览器。

打开那个网址后，浏览器显示的内容如下图所示：

注意：不可开着代理之类的，网络必须直连。

2、软件的使用

首先，上传相片，上传音频，如下图所示音频可以用文字转语音工具制作，也可以自己录制。

接着，设置一下右边的选项，有两种建议方案

第一种设置方案

该方案生成的数字人和原图一样大，头部动作幅度虽然较小但不会出现头部和身子分离的现象，身子不动。

请按照下图设置

第二种设置方案

该方案会对原图进行裁切，只生成头部视频，没有身子，生成的数字人表情动作比第一种方案更丰富，更生动，请按照下图设置。

3、下载生成视频

设置完成后，点"生成”，稍等一会，就会在左下方生成视频。原来的那个黑色窗口里会看到进度。

生成视频后，在生成的视频上点右键，会看到下载选项。

如果找不到下载选项，可以直接打开软件目录里的“results”文件夹再打开里面的文件夹，会看到几个 mp4文件，有的仅是头部，有的是普通画质，有的是超清画质，都打开看看，找个好的。

4、处理说明

处理方式说明。

crop:对原图进行裁切，只生成头部视频，没有身子，生成的数字人表情动作丰富，更生动。

resize:生成的数字人身子也稍微动，但效果很烂，太假，不建议使用。

full:生成的数字人和原图一样大，身子不动，如果勾选”静态模式”，则头部动作幅度较小，但不会出现头部和身子分离的现象;如果不勾选”静态模式”，则头部动作幅度更大，但有时候会出现头部和身子分离的现象。

extcrop、exfull: 与 crop、full 功能一样，但对头部的裁剪范围更大。

其他说明

姿态 Pose style: 头部晃动幅度，值越大，表情晃动越厉害。

expression scale: 脸部表情幅度，尤其是嘴唇，值越大，动作越大。

batch size in generation: 值越大，处理越快，但对显卡要求越高。显卡不好选 1就行。

启用参考视频 Use Reference Video 。

下方的选项pose:生成的数字人的脸部姿势和参考视频一致。

blink:生成的数字人眨眼和参考视频一致。

pose+blink:生成的数字人脸部、眨眼与参考视频一致all:生成的数字人和参考视频全部保持一致，包括声音。

相关文件下载地址

百度网盘夸克网盘 123网盘

©下载资源版权归作者所有；本站所有资源均来源于网络，仅供学习使用，请支持正版！

免责声明本站提供的一切软件、教程和内容信息仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络收集整理，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容，请支持正版，购买注册，得到更好的正版服务。我们非常重视版权问题，如有侵权请邮件与我们联系处理。敬请谅解！侵删请致信E-mail：995113774@qq.com

THE END

1

打赏

分享

二维码

海报

Cool EM Launcher EMUI启动器v7.7.1纯净版

安卓WIFI钥匙V1.0.13精简显密版

发表评论

评论列表

赶快来坐沙发

小高教学网

网络技术爱好者的栖息之地,让我们的技术更上一层楼!

数据统计

本周更新

64篇

本月更新

247篇

用户数量

5082位

微博:

小高网的自留地

去看看

B站:

@小高教学网

去看看

QQ:

995113774

微信:

qq84065994

日历

3月

星期天

23

一
二
三
四
五
六
日