# 智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”

Linly-Dubbing WebUI

[![madewithlove](https://img.shields.io/badge/made_with-%E2%9D%A4-red?style=for-the-badge&labelColor=orange)](https://github.com/Kedreamix/Linly-Dubbing)
[![Open In Colab](https://img.shields.io/badge/Colab-F9AB00?style=for-the-badge&logo=googlecolab&color=525252)](https://colab.research.google.com/github/Kedreamix/Linly-Dubbing/blob/main/colab_webui.ipynb) [![Licence](https://img.shields.io/badge/LICENSE-Apache-red.svg?style=for-the-badge)](https://github.com/Kedreamix/Linly-Dubbing/blob/main/LICENSE) [**English**](./README.md) | [**中文简体**](./README_zh.md)
---
目录 - [智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”](#智能视频多语言ai配音翻译工具---linly-dubbing--ai赋能语言无界) - [介绍](#介绍) - [TO DO LIST](#to-do-list) - [示例](#示例) - [安装与使用指南](#安装与使用指南) - [测试环境](#测试环境) - [1. 克隆代码仓库](#1-克隆代码仓库) - [2. 安装依赖环境](#2-安装依赖环境) - [3. 配置环境变量](#3-配置环境变量) - [4. 运行程序](#4-运行程序) - [详细功能和技术细节](#详细功能和技术细节) - [自动下载视频](#自动下载视频) - [人声分离](#人声分离) - [Demucs](#demucs) - [UVR5](#uvr5) - [AI 智能语音识别](#ai-智能语音识别) - [WhisperX](#whisperx) - [FunASR](#funasr) - [大型语言模型字幕翻译](#大型语言模型字幕翻译) - [OpenAI API](#openai-api) - [Qwen](#qwen) - [Google Translate](#google-translate) - [AI 语音合成](#ai-语音合成) - [Edge TTS](#edge-tts) - [XTTS](#xtts) - [CosyVoice](#cosyvoice) - [GPT-SoVITS](#gpt-sovits) - [视频处理](#视频处理) - [数字人对口型技术](#数字人对口型技术) - [许可协议](#许可协议) - [参考](#参考) - [Star History](#star-history)
## 介绍 `Linly-Dubbing` 是一个智能视频多语言AI配音和翻译工具,它融合了[`YouDub-webui`](https://github.com/liuzhao1225/YouDub-webui)的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成[`Linly-Talker`](https://github.com/Kedreamix/Linly-Talker)的数字人对口型技术,为用户带来更加自然的多语言视频体验。 通过整合最新的AI技术,`Linly-Dubbing` 在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。 主要特点包括: - **多语言支持**: 支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。 - **AI 智能语音识别**: 使用先进的AI技术进行语音识别,提供精确的语音到文本转换和说话者识别。 - **大型语言模型翻译**: 结合领先的本地化大型语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。 - **AI 声音克隆**: 利用尖端的声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的连贯性。 - **数字人对口型技术**: 通过对口型技术,使配音与视频画面高度契合,提升真实性和互动性。 - **灵活上传与翻译**: 用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。 - **定期更新**: 持续引入最新模型,保持配音和翻译的领先地位。 我们旨在为用户提供无缝、高质量的多语言视频配音和翻译服务,为内容创作者和企业在全球市场中提供有力支持。 --- ## TO DO LIST - [x] 完成AI配音和智能翻译功能的基础实现 - [x] 集成CosyVoice的AI声音克隆算法,实现高质量音频翻译 - [x] 增加FunASR的AI语音识别算法,特别优化对中文的支持 - [x] 利用Qwen大语言模型实现多语言翻译 - [x] 开发Linly-Dubbing WebUI,提供一键生成最终视频的便捷功能,并支持多种参数配置 - [ ] 加入UVR5进行人声/伴奏分离和混响移除,参考GPTSoVits - [ ] 提升声音克隆的自然度,考虑使用GPTSoVits进行微调,加入GPTSoVits - [ ] 实现并优化数字人对口型技术,提升配音与画面的契合度 --- ## 示例 | 原视频 | Linly-Dubbing | | ------------------------------------------------------------ | ------------------------------------------------------------ | |