音声認識+翻訳

音声からバイリンガル字幕までのワークフローをワンクリックで完了します。

音声認識+翻訳とは

音声からバイリンガル字幕までのワークフローをワンクリックで完了します。まず音声認識でソース言語字幕を生成し、次に自動的にターゲット言語に翻訳します。素早くバイリンガル字幕を取得したい場合に適しています。

出力:ソース言語 SRT + ターゲット言語 SRT。

使い方

  1. 動画をインポート 動画ファイルをメディアライブラリにドラッグするか、インポートボタンをクリックして動画を追加します。
  2. 「音声認識+翻訳」タブに切り替え 左側の設定エリアで「音声認識+翻訳」タブをクリックします。
  3. ソース言語とターゲット言語を選択 ソース言語(動画で話されている言語)とターゲット言語(翻訳先の言語)を設定します。
  4. 翻訳エンジンを選択 ニーズに合わせて適切な翻訳エンジンを選択します(エンジン選択の参考は翻訳ページのエンジン比較表をご覧ください)。
  5. 「音声認識+翻訳を実行」をクリック 下部の実行ボタンをクリックして処理を開始します。
  6. 翻訳方向の確認ダイアログ ソース言語とターゲット言語が正しいかどうかを確認するダイアログが表示されます。
  7. バイリンガル結果を確認 処理完了後、「字幕エディタを開く」をクリックして生成されたバイリンガル字幕を確認します。

2つの処理モード

「詳細設定」で処理モードを選択できます:

標準モード(デフォルト)

動画全体を一度に処理するため、最も効率的です。結果をすぐに見る必要がない場合に適しています。

クイックビューモード

2分ごとに分割して処理します。最初の2分が処理されるとすぐに結果を確認でき、残りの部分はバックグラウンドで処理が続きます。早く効果を確認したい場合に適しています。

詳細設定

設定 説明
認識モデル 音声認識ページと同様、認識モデルを選択します
カスタム翻訳指示 翻訳ページと同様、用語やスタイルの要件を追加します
ソース言語文字数上限 書き起こし字幕の1行あたりの長さを制御します
ターゲット言語文字数上限 翻訳字幕の1行あたりの長さを制御し、バイリンガルの整列を維持します
AI 句読点修正 PRO 音声認識の句読点を修正します
バラエティモード バラエティ番組/リアリティショー向けに最適化

個別実行との違い

「音声認識+翻訳」は、「音声認識」を実行した後に「翻訳」を実行するのと同等ですが、操作がより簡単です。ワンクリックでワークフロー全体を完了できます。

個別実行の利点は、途中のステップでソース言語字幕を確認・修正してから翻訳できることです。ソース言語字幕の品質に高い要件がある場合に適しています。

よくある質問

標準モードとクイックビューモードはどちらが良いですか?

標準モードの方が効率的で、ほとんどのケースで推奨されます。クイックビューモードは長い動画や、先に結果を確認したい場合に適しています。

ソース言語字幕のみで翻訳は不要な場合は?

はい、「音声認識」タブを直接使用すれば、ソース言語字幕のみを生成して翻訳は行いません。