pyVideoTrans

pyVideoTrans是什么

pyVideoTrans是一款开源的视频翻译配音工具，能够将视频内容从一种语言自动翻译成另一种语言，并添加相应的字幕和配音。它结合了语音识别、文本翻译、语音合成（TTS）和视频处理技术，支持多语言翻译（如中、英、西语等），适用于影视后期、教育、广告等场景。

pyVideoTrans的主要功能

语音识别
- 基于 OpenAI Whisper 或 Faster Whisper 等离线模型，将视频中的语音转换为文字。
- 支持无网络环境下的语音识别，保护隐私。
自动翻译
- 集成多种翻译引擎，如 Google 翻译、百度翻译、腾讯翻译、DeepL、ChatGPT、Gemini 等。
- 支持 24 种语言，部分翻译渠道无需代理即可直接使用。
高质量配音
- 使用 Microsoft Edge TTS、OpenAI TTS-1、Elevenlabs TTS 等技术生成自然流畅的配音。
- 支持选择不同的配音角色（如男声、女声）。
字幕生成与合并
- 自动生成与视频同步的字幕文件（SRT 格式），并支持手动修改。
- 将字幕嵌入视频或与音频、视频文件合并。
音视频处理
- 音视频分离：从视频中提取音频或分离无声视频。
- 格式转换：支持多种视频/音频格式的相互转换。
- 字幕翻译：将现有字幕文件翻译为其他语言。
其他功能
- YouTube 视频下载：直接下载 YouTube 视频并处理。
- 自定义配置：调整翻译引擎、配音角色、字幕样式等。

如何使用pyVideoTrans

1. 下载与安装

Windows 用户：
下载预打包版本（如 sp.exe），解压后双击运行。

其他系统（Linux/macOS）：
通过源码部署（需 Python 3.10+ 环境）：

[Bash]

# 安装 Python 3.10 并配置环境
git clone https://github.com/jianchang512/pyvideotrans
cd pyvideotrans
python -m venv venv
.\venv\scripts\activate
pip install -r requirements.txt
# 运行软件
python sp.py

2. 基本操作流程

选择视频：点击 “Select Video”，确保视频中有人类说话声。
配置参数：
- 源语言：选择视频中语音的语言（如英语）。
- 目标语言：选择翻译后的语言（如中文）。
- 翻译引擎：选择 Google、Microsoft 等（部分需代理）。
- 配音角色：选择 TTS 语音角色（如 Microsoft Edge 的 Aria 女声）。
执行翻译：
- 软件会自动完成语音识别、翻译、配音生成及字幕嵌入。
导出视频：合并音视频与字幕后，保存为新视频文件。

3. 代码示例（API 调用）

[Python]

from pyvideotrans import VideoTranslator

translator = VideoTranslator()
translator.set_source_video("example.mp4")          # 设置源视频
translator.set_target_language("es")                # 目标语言（西班牙语）
translator.translate_and_speak()                    # 翻译并生成配音
translator.merge_output("translated_video.mp4")     # 合并输出

pyVideoTrans的应用场景

跨语言视频内容制作
- 全球化传播：将视频翻译成多语言版本，扩大受众范围（如电影、纪录片）。
- 多语言版本制作：自动处理翻译、配音和字幕嵌入，节省人力成本。
教育领域
- 多语言教学资源：将课程视频翻译成不同语言，适应国际学生需求。
- 远程教育：为不同地区的学生提供本地化语言的课程内容。
广告与营销
- 多语言广告推广：针对不同市场制作本地化广告视频，提升品牌影响力。
自媒体与影视后期
- 快速制作多语言版本：创作者可轻松将作品翻译成其他语言，吸引全球观众。
企业宣传
- 内部培训材料：将企业培训视频翻译成员工母语，提高理解效率。