문자 인식 (OCR)

영상 화면에서 기존의 번인 자막을 추출합니다

기본 버전과 Pro 버전 OCR 자막 추출은 무료이며 시간 제한이 없습니다.

문자 인식 (OCR)이란

문자 인식 (OCR) 기능은 영상 화면에서 기존의 번인 자막(하드 자막)을 추출하여 편집 가능한 SRT 자막 파일을 생성합니다. 영상에 이미 보이는 자막이 있지만 별도의 자막 파일이 없는 경우에 적합하며, 인터넷에서 다운로드한 자막이 포함된 영상, TV 프로그램 녹화본 등에 활용할 수 있습니다.

음성 인식과 달리 OCR은 오디오 트랙이 아닌 영상 화면을 분석하므로, 화면에 "번인"된 모든 텍스트를 인식할 수 있습니다.

사용 방법

미디어 라이브러리에 영상 가져오기영상 파일을 GeekLink의 미디어 라이브러리에 끌어다 놓거나, "영상 추가" 버튼을 클릭하여 파일을 선택합니다.
"화면에 표시됨" 선택설정 영역에서 이 항목을 선택합니다(화면에서 인식, 즉 OCR). 자막이 화면에 번인된 영상에 사용합니다.
원문 언어 선택영상 자막의 OCR 인식 언어를 선택합니다.
"문자 인식 실행" 클릭설정을 확인한 후 버튼을 클릭하여 처리를 시작합니다.
자막 영역 확인선택 화면이 열리면 자막 줄이 자동으로 감지되어 정확한 위치가 빨간 표시로 나타납니다. 대부분의 경우 타임라인을 드래그해 표시가 자막에 계속 붙어 있는지 확인하고 확인을 누르기만 하면 됩니다. 감지가 어긋나면 화면에서 드래그하여 박스를 그리세요. OCR은 해당 영역 안의 텍스트만 읽고 로고, 워터마크, 채널 배지 등은 자동으로 무시합니다(자세한 내용은 아래 설명 참조).
색상 샘플링 (선택 사항)더 많은 설정에서 "자막 필터 미세 조정 (색상)"을 켠 경우에만 색상 선택기 단계로 이동합니다 — 영상 프레임에서 자막 텍스트를 칠하여 색상을 샘플링합니다(자세한 내용은 아래 설명 참조). 켜지 않은 경우 OCR이 박스 안의 모든 줄을 읽으므로 이 단계는 건너뜁니다.
색상 확인색상 선택기에서 칠하기를 완료한 후 "색상 확인"을 클릭하여 계속합니다.
OCR 완료 대기시스템이 자동으로 영상 화면을 프레임별로 스캔하여 텍스트를 추출합니다.
결과 확인완료되었습니다! 자막 편집기를 열어 인식 결과를 확인하고 편집하세요.

자막 영역 확인

실행을 클릭하면 영역 선택 화면이 열리고 자막 줄이 자동으로 감지됩니다. 정확한 위치가 빨간 표시로 나타나고 오른쪽에 "감지된 자막 줄" 항목이 표시됩니다. 대부분의 경우 타임라인을 드래그해 빨간 표시가 자막에 계속 붙어 있는지 확인한 뒤 확인을 누르기만 하면 됩니다 — 직접 박스를 그릴 필요가 없습니다.

감지된 위치가 맞지 않으면 화면에서 드래그하여 박스를 그리세요. 직접 그린 박스가 우선 적용됩니다(감지된 줄은 오른쪽 목록에 남아 있으며 삭제 버튼으로 개별 삭제할 수 있습니다). 이 단계는 OCR에게 해당 영역 안의 텍스트만 읽고 화면의 로고, 워터마크, 채널 배지는 무시하도록 알려주어, 추출 결과에 자막 줄만 포함되도록 합니다.

영역 선택 화면은 이제 감지된 텍스트 영역을 실시간으로 강조 표시합니다. 일시 정지하거나 타임라인을 드래그하면 OCR이 읽어들일 모든 텍스트 주위에 감지 박스가 나타나므로, 박스가 정확한지, 다른 텍스트가 끼어들지 않았는지 한눈에 확인할 수 있습니다(필요 없으면 "텍스트 감지 박스 숨기기"를 체크하여 오버레이를 끌 수 있습니다). 게임 UI 숫자나 구석의 작은 캡션처럼 작은 방해 텍스트가 박스 안에 들어온다면 "작은 글자 무시" 슬라이더를 드래그하세요. 걸러진 감지 박스가 실시간으로 흐려지므로, 자막만 선명하게 강조된 상태가 될 때까지 드래그하면 됩니다.

GeekLink에서 자막 영역을 박스로 지정 — OCR이 박스 안의 텍스트만 읽습니다

자막 필터 미세 조정 — 색상(선택 사항)

기본적으로 OCR은 박스 안의 모든 텍스트 줄을 읽습니다. 그래도 자막과 비슷한 크기의 잡음 — 같은 영역에 있는 워터마크나 화면 내 표시 — 이 박스에 함께 잡힌다면, 더 많은 설정에서 "자막 필터 미세 조정 (색상)"을 켜세요. 실제 자막을 색상으로 분리하는 선택기 단계가 추가됩니다. 켜지 않으면 OCR은 박스 안의 모든 것을 그대로 읽습니다. (글꼴 크기로 필터링하는 기능은 이제 영역 선택 단계의 "작은 글자 무시" 슬라이더에 내장되어 있으므로, 그 용도로는 이 옵션을 켤 필요가 없습니다.)

자막 색상 샘플링

영상 프레임에서 마우스로 자막 텍스트 영역을 칠하면 시스템이 칠한 위치의 색상을 자동으로 수집합니다
+/- 버튼으로 화면을 확대/축소하여 작은 자막도 정확하게 칠할 수 있습니다
잘못 칠한 경우 "칠하기 지우기"를 클릭하여 다시 시작할 수 있습니다
최소 샘플링 수량에 도달하면 "색상 확인" 버튼이 클릭 가능 상태가 됩니다

가능하면 자막 텍스트의 획 위에 직접 칠하고, 자막 주변의 배경 영역은 피하세요. 샘플링이 정확할수록 인식 결과가 좋아집니다.

글꼴 크기 필터링은 어디로 갔나요?

글꼴 크기 필터링은 영역 선택 단계로 앞당겨졌습니다. "작은 글자 무시" 슬라이더를 드래그하면 감지 박스가 실시간으로 흐려지며 작은 방해 텍스트를 걸러낼 수 있어, 여기서 픽셀 값을 직접 입력할 필요가 없어졌습니다. 색상 선택 화면은 이제 색상 샘플링 한 가지에만 집중합니다.

다른 언어 제외(선택 사항)

일부 프레임에는 두 가지 문자 체계의 번인 텍스트가 동시에 포함되어 있습니다 — 예를 들어 일본어 영상에 중국어 자막이 위에 추가되거나, 한 언어로 된 화면 표지판 아래에 다른 언어의 자막이 있는 경우입니다. "텍스트 필터링" 설정을 사용하면 문자 체계 전체를 제외하여 OCR이 무시하도록 할 수 있습니다. 원하지 않는 언어(일본어, 한국어, 중국어, 태국어, 아랍어)를 선택하면 해당 텍스트가 제거되어 자막 줄만 남습니다.

OCR 설정 상세

설정	설명	권장 사항
원문 언어	OCR 인식 언어	영상 자막의 언어를 선택하세요
자막 영역	스캔 범위 제한: 하단 / 하단 20% / 상반부 / 전체 화면	자막은 보통 하단에 있으므로 "하단" 또는 "하단 20%"를 선택하면 오인식을 줄이고 속도를 높일 수 있습니다
감지 간격	프레임 추출 빈도: 0.1초(가장 정밀) / 0.25초 / 0.3초 / 0.5초 / 1.0초	기본값으로 충분합니다. 자막이 빠르게 전환되거나 순간적으로 나타나는 영상은 0.1초로 낮추세요(처리 시간은 늘어납니다)
텍스트 필터	지정된 언어의 문자를 제외	화면에 필요 없는 일본어/한국어/태국어 등이 있을 때 사용하세요
모든 텍스트 추출	색상 샘플링을 건너뛰고 화면의 모든 텍스트를 추출	자막 색상이 고정되지 않거나 여러 색상인 경우 사용하세요
AI 향상 PRO	구두점 교정 + 시각적 재검사로 OCR 품질을 향상	처리 속도가 느려지므로 필요에 따라 활성화하세요

자주 묻는 질문

왜 많은 깨진 문자가 인식되나요?

색상 샘플링이 충분히 정확하지 않아 OCR 엔진이 배경 텍스처도 텍스트로 처리했을 수 있습니다. 다시 샘플링하여 자막 텍스트의 획 영역만 칠하는 것을 권장합니다. 자막이 더 선명한 다른 프레임에서 다시 작업해 보세요.

어떤 언어를 지원하나요?

현재 OCR은 다음 언어를 지원합니다: 영어, 중국어 간체, 중국어 번체, 중영 이중 언어, 일본어, 한국어, 베트남어, 스페인어, 포르투갈어, 프랑스어, 독일어, 이탈리아어, 인도네시아어.

왜 일부 자막이 인식되지 않나요?

감지 간격이 너무 커서 자막이 순간적으로 지나가 샘플링되지 않았을 수 있습니다. 감지 간격을 0.1초(가장 정밀)로 낮추면 더 빠르게 전환되거나 순간적으로 나타나는 자막도 포착할 수 있습니다. 단, 처리 시간이 그에 따라 늘어납니다.