语音识别 + 翻译

一键完成从语音到双语字幕的全流程。

什么是语音识别 + 翻译

一键完成从语音到双语字幕的全流程:先进行语音识别生成源语言字幕,再自动翻译成目标语言。适用于需要快速获得双语字幕的场景。

输出:源语言 SRT + 目标语言 SRT。

使用步骤

  1. 导入视频 将视频文件拖入素材库,或点击导入按钮添加视频。
  2. 切换到「语音识别 + 翻译」Tab 在左侧设置区点击「语音识别 + 翻译」Tab。
  3. 选择源语言和目标语言 设置源语言(视频中说的语言)和目标语言(想要翻译成的语言)。
  4. 选择翻译引擎 根据需求选择合适的翻译引擎(引擎选择参考翻译页面的引擎对比表)。
  5. 点击「运行 语音识别 + 翻译」 点击底部的运行按钮开始处理。
  6. 确认翻译方向弹窗 系统会弹出确认窗口,确认源语言和目标语言是否正确。
  7. 查看双语结果 等待处理完成后,点击「打开字幕编辑器」查看生成的双语字幕。

两种处理模式

在「更多设置」中可以选择处理模式:

标准模式(默认)

一次性处理整个视频,效率最高。适合不急着看结果的场景。

快速查看模式

按 2 分钟分段处理。处理完前 2 分钟后即可实时查看结果,后台继续处理剩余部分。适合想尽快看到效果的场景。

更多设置

设置 说明
识别模型 语音识别页面,选择识别模型
自定义翻译指令 翻译页面,补充术语和风格要求
源语言字数上限 控制转写字幕单条长度
目标语言字数上限 控制翻译字幕单条长度,保持双语对齐
AI 标点修正 PRO 修正语音识别的标点
综艺模式 针对综艺/真人秀优化

与分开执行的区别

「语音识别 + 翻译」等同于先跑「语音识别」再跑「翻译」,但操作更方便——只需一次点击即可完成全流程。

分开执行的优势是可以在中间步骤检查和修改源语言字幕后再翻译,适合对源语言字幕质量要求较高的场景。

常见问题

标准模式和快速查看模式哪个好?

标准模式效率更高,推荐大多数场景使用。快速查看模式适合长视频或需要先看效果的情况。

可以只要源语言字幕不要翻译吗?

可以,直接使用「语音识别」Tab 即可,只生成源语言字幕而不翻译。