문자 인식 (OCR)
영상 화면에서 기존의 번인 자막을 추출합니다
기본 버전과 Pro 버전
기본 버전은 5분 이내의 영상 자막을 무료로 추출할 수 있습니다. Pro 버전은 시간 제한이 없습니다.
문자 인식 (OCR)이란
문자 인식 (OCR) 기능은 영상 화면에서 기존의 번인 자막(하드 자막)을 추출하여 편집 가능한 SRT 자막 파일을 생성합니다. 영상에 이미 보이는 자막이 있지만 별도의 자막 파일이 없는 경우에 적합하며, 인터넷에서 다운로드한 자막이 포함된 영상, TV 프로그램 녹화본 등에 활용할 수 있습니다.
음성 인식과 달리 OCR은 오디오 트랙이 아닌 영상 화면을 분석하므로, 화면에 "번인"된 모든 텍스트를 인식할 수 있습니다.
사용 방법
- 미디어 라이브러리에 영상 가져오기영상 파일을 GeekLink의 미디어 라이브러리에 끌어다 놓거나, "영상 추가" 버튼을 클릭하여 파일을 선택합니다.
- "문자 인식" 탭으로 전환메인 화면 상단에서 "문자 인식" 탭을 선택합니다.
- 원본 언어 선택영상 자막의 OCR 인식 언어를 선택합니다.
- "문자 인식 실행" 클릭설정을 확인한 후 버튼을 클릭하여 처리를 시작합니다.
- 색상 샘플링 (선택 사항)"모든 텍스트 추출"을 선택하지 않은 경우 색상 선택기 단계로 이동합니다. 영상 프레임에서 자막 텍스트를 칠하여 색상을 샘플링합니다(자세한 내용은 아래 설명 참조).
- 색상 확인색상 선택기에서 칠하기를 완료한 후 "색상 확인"을 클릭하여 계속합니다.
- OCR 완료 대기시스템이 자동으로 영상 화면을 프레임별로 스캔하여 텍스트를 추출합니다.
- 결과 확인완료되었습니다! 자막 편집기를 열어 인식 결과를 확인하고 편집하세요.
색상 선택기
영상 화면에는 자막 텍스트 외에도 워터마크, 로고, 화면 내 텍스트 표시 등 다양한 텍스트 콘텐츠가 있을 수 있습니다. 색상 샘플링의 목적은 OCR 엔진이 자막 텍스트의 색상을 통해 추출하려는 대상 자막에 집중할 수 있도록 돕는 것입니다.
조작 방법
- 영상 프레임에서 마우스로 자막 텍스트 영역을 칠하면 시스템이 칠한 위치의 색상을 자동으로 수집합니다
- +/- 버튼으로 화면을 확대/축소하여 작은 자막도 정확하게 칠할 수 있습니다
- 잘못 칠한 경우 "칠하기 지우기"를 클릭하여 다시 시작할 수 있습니다
- 최소 샘플링 수량에 도달하면 "색상 확인" 버튼이 클릭 가능 상태가 됩니다
- "글꼴 높이 필터"를 사용하여 최소/최대 픽셀 값을 설정하면 워터마크 등 자막이 아닌 텍스트를 필터링할 수 있습니다(비워두면 제한 없음)
팁
가능하면 자막 텍스트의 획 위에 칠하고, 자막 주변의 배경 영역은 칠하지 마세요. 샘플링이 정확할수록 인식 결과가 좋아집니다. 화면에 빨간 숫자로 표시된 것은 감지된 텍스트 행 높이(픽셀)이며, 이를 기준으로 글꼴 높이 필터 범위를 설정할 수 있습니다.
OCR 설정 상세
| 설정 | 설명 | 권장 사항 |
|---|---|---|
| 원본 언어 | OCR 인식 언어 | 영상 자막의 언어를 선택하세요 |
| 자막 영역 | 스캔 범위 제한: 하단 / 하단 20% / 상반부 / 전체 화면 | 자막은 보통 하단에 있으므로 "하단" 또는 "하단 20%"를 선택하면 오인식을 줄이고 속도를 높일 수 있습니다 |
| 감지 간격 | 프레임 추출 빈도: 0.25초 / 0.3초 / 0.5초 / 1.0초 | 기본 0.5초로 충분합니다. 자막이 빠르게 전환되는 영상은 0.25초로 낮추세요 |
| 텍스트 필터 | 지정된 언어의 문자를 제외 | 화면에 필요 없는 일본어/한국어/태국어 등이 있을 때 사용하세요 |
| 모든 텍스트 추출 | 색상 샘플링을 건너뛰고 화면의 모든 텍스트를 추출 | 자막 색상이 고정되지 않거나 여러 색상인 경우 사용하세요 |
| 이전 스타일 프리셋 사용 | 이전의 색상 샘플링을 재사용 | 같은 시리즈 영상을 일괄 처리할 때 반복 샘플링을 생략할 수 있습니다 |
| AI 향상 PRO | 구두점 교정 + 시각적 재검사로 OCR 품질을 향상 | 처리 속도가 느려지므로 필요에 따라 활성화하세요 |
자주 묻는 질문
왜 많은 깨진 문자가 인식되나요?
색상 샘플링이 충분히 정확하지 않아 OCR 엔진이 배경 텍스처도 텍스트로 처리했을 수 있습니다. 다시 샘플링하여 자막 텍스트의 획 영역만 칠하는 것을 권장합니다. 자막이 더 선명한 다른 프레임에서 다시 작업해 보세요.
어떤 언어를 지원하나요?
현재 OCR은 다음 언어를 지원합니다: 중국어 간체, 중국어 번체, 중영 이중 언어, 영어, 일본어, 한국어, 베트남어.
왜 일부 자막이 인식되지 않나요?
감지 간격이 너무 커서 자막이 순간적으로 지나가 샘플링되지 않았을 수 있습니다. 감지 간격을 0.25초로 낮추면 더 빠르게 전환되는 자막도 포착할 수 있습니다. 단, 처리 시간이 그에 따라 늘어납니다.