文字認識(OCR)
動画画面から既存の焼付字幕を抽出します
基本版と Pro 版
基本版では 5 分以内の動画の字幕を無料で抽出できます。Pro 版には時間制限がありません。
文字認識(OCR)とは
文字認識(OCR)機能は、動画画面から既存の焼付字幕(ハードサブ)を抽出し、編集可能な SRT 字幕ファイルを生成します。動画に目に見える字幕があるものの、独立した字幕ファイルがない場合に適しています。例えば、インターネットからダウンロードした字幕付き動画、テレビ番組の録画などです。
音声認識とは異なり、OCR は音声トラックではなく動画の画面を分析するため、画面上に「焼き付け」られたあらゆるテキストを認識できます。
使い方
- 動画をメディアライブラリにインポート動画ファイルを GeekLink のメディアライブラリにドラッグするか、「動画を追加」ボタンをクリックしてファイルを選択します。
- 「文字認識」タブに切り替えメインインターフェース上部で「文字認識」タブを選択します。
- ソース言語を選択動画字幕の OCR 認識言語を選択します。
- 「文字認識を実行」をクリック設定を確認したら、ボタンをクリックして処理を開始します。
- カラーサンプリング(任意)「全テキストを抽出」にチェックが入っていない場合、カラーセレクターのステップに進みます。動画フレーム上で字幕テキストをなぞって色をサンプリングします(詳細は下記参照)。
- 色を確認カラーセレクターでなぞり終えたら、「色を確認」をクリックして続行します。
- OCR 完了を待つシステムが自動的に動画画面をフレームごとにスキャンし、テキスト内容を抽出します。
- 結果を確認完了です。字幕エディタを開いて認識結果を確認・編集します。
カラーセレクター
動画画面には字幕テキスト以外にも、ウォーターマーク、ロゴ、画面内のテキスト表示など、多くのテキスト要素があります。カラーサンプリングの目的は、字幕テキストの色によってターゲットの字幕を区別し、OCR エンジンが抽出したい字幕に焦点を当てるようにすることです。
操作方法
- 動画フレーム上でマウスを使って字幕テキスト部分をなぞります。システムがなぞった位置の色を自動的に取得します
- +/- ボタンで画面を拡大・縮小でき、小さい字幕を正確になぞるのに便利です
- 間違えた場合は「なぞりをクリア」をクリックしてやり直せます
- 最小サンプル量に達すると、「色を確認」ボタンがクリック可能になります
- 「フォント高さフィルター」で最小・最大ピクセル値を設定し、ウォーターマークなど字幕以外のテキストをフィルタリングできます(空欄の場合は制限なし)
ヒント
できるだけ字幕テキストの文字のストローク上をなぞり、字幕周辺の背景部分をなぞらないようにしてください。サンプリングが正確であるほど、認識結果が良くなります。画面上の赤い数字は検出されたテキストの行高(ピクセル)を示しており、それを参考にフォント高さフィルターの範囲を設定できます。
OCR 設定の詳細
| 設定 | 説明 | 推奨 |
|---|---|---|
| ソース言語 | OCR 認識の言語 | 動画字幕の言語を選択してください |
| 字幕エリア | スキャン範囲を制限:下部 / 下部20% / 上半分 / 全画面 | 字幕は通常下部にあるため、「下部」または「下部20%」を選ぶと誤認識を減らし速度を上げられます |
| 検出間隔 | フレーム抽出頻度:0.25s / 0.3s / 0.5s / 1.0s | デフォルトの 0.5s で十分です。字幕の切り替えが速い動画では 0.25s に下げてください |
| テキストフィルター | 指定した言語の文字を除外 | 画面に不要な日本語/韓国語/タイ語などがある場合に使用します |
| 全テキストを抽出 | カラーサンプリングをスキップし、画面内のすべてのテキストを抽出 | 字幕の色が一定でない場合や複数の色がある場合に使用します |
| 前回のスタイルプリセットを使用 | 前回のカラーサンプリングを再利用 | 同シリーズの動画をバッチ処理する際、サンプリングの繰り返しを省けます |
| AI 拡張 PRO | 句読点修正+視覚的な再チェックで OCR の品質を向上 | 処理速度が遅くなります。必要に応じて有効にしてください |
よくある質問
文字化けが多く認識されるのはなぜですか?
カラーサンプリングの精度が不十分で、OCR エンジンが背景のテクスチャもテキストとして処理してしまっている可能性があります。再サンプリングし、できるだけ字幕テキストのストローク部分のみをなぞるようにしてください。また、字幕がより鮮明な別のフレームで再操作することもお試しください。
対応言語は何ですか?
現在、OCR は以下の言語に対応しています:簡体字中国語、繁体字中国語、中英バイリンガル、英語、日本語、韓国語、ベトナム語。
一部の字幕が認識されないのはなぜですか?
検出間隔が大きすぎて、字幕が一瞬で表示・消滅しサンプリングされていない可能性があります。検出間隔を 0.25s に下げてみてください。切り替えが速い字幕もキャプチャできるようになります。ただし、処理時間は相応に増加します。