SadTalker

⭐ 13.9k Apache-2.0 Python 3.0.0

经典数字人生成,一张照片+音频=逼真说话视频,3D 运动系数学习

📋 基本信息

GitHub Stars⭐ 13.9k Stars
开源许可证Apache-2.0
编程语言Python
最新版本3.0.0
最近更新2026-03-20

⬇️ 下载

📦 文件大小: Git 克隆

⬇️ 下载 Python 版
⚡ 网盘加速获取(国内高速)

📖 详细介绍

SadTalker 是 AI 数字人领域的经典开源标杆(13.9k Stars)。只需一张人脸照片+一段音频,即可生成逼真的说话视频。核心创新是 3D 运动系数学习——先生成 3D 面部运动参数(头姿、表情、眨眼),再渲染为 2D 视频,效果自然不生硬。支持全身模式。Gradio WebUI 方便使用。适合快速制作说话头像视频的创作者。

✨ 核心特性

  • 一张照片 + 音频 = 说话视频
  • 3D 运动系数学习——效果自然
  • 头姿/表情/眨眼全自动
  • 全身模式(头+上半身)
  • Gradio WebUI——使用简单

Advertisement

🚀 快速开始

git clone https://github.com/OpenTalker/SadTalker.git
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113

🔗 同分类其他工具