이미지 텍스트 추출이란?

기기에서 완전히 동작하는 Tesseract OCR로 이미지, 스크린샷, 스캔 문서, 사진에서 텍스트를 추출합니다. 여러 언어를 지원하며, 복사하거나 다운로드할 수 있는 편집 가능한 텍스트를 출력합니다. 파일이 기기를 떠나지 않으며 모든 처리가 로컬에서 이루어집니다.

이 도구에는 WebAssembly로 컴파일된 Tesseract OCR와 20개의 학습된 언어 팩(영어, 스페인어, 프랑스어, 독일어, 이탈리아어, 네덜란드어, 포르투갈어, 폴란드어, 스웨덴어, 터키어, 러시아어, 아랍어, 힌디어, 태국어, 베트남어, 중국어 간체/번체, 일본어, 한국어, 인도네시아어)이 포함되어 있습니다. 각 팩은 처음 사용할 때 한 번 내려받은 뒤 캐시에 저장됩니다. 이미지나 한 페이지짜리 PDF를 불러오고, 기울어진 사진을 회전하고, 인식 전에 영역을 선택한 다음, 결과를 일반 텍스트나 Word 문서로 저장할 수 있습니다. 스크린샷, 300dpi 스캔, 선명한 영수증에서는 정확도가 높아 인쇄물은 95% 이상을 기대할 수 있고, 손글씨나 기울어진 사진에서는 낮아집니다.

사용 방법

  1. 추출할 텍스트가 담긴 이미지(PNG, JPG, BMP, WebP)나 한 페이지짜리 PDF를 업로드하거나 클립보드에서 스크린샷을 붙여넣으세요. 처음이신가요? 샘플 사용해 보기를 누르면 예시로 작동을 확인할 수 있습니다.
  2. 인식 정확도를 높이기 위해 이미지 속 텍스트의 언어를 선택하세요. '텍스트 추출'을 클릭하여 OCR 처리를 시작하세요.
  3. 추출된 텍스트를 확인하고 잘못된 부분을 고친 뒤, 복사하거나 .txt 또는 Word(.docx) 파일로 다운로드하세요.

사용 시기

  • 복사 금지된 PDF나 채팅, 슬라이드 스크린샷에서 편집 가능한 텍스트 뽑기.
  • 종이 영수증 사진을 가계부 스프레드시트에 옮겨 적기.
  • 손글씨나 인쇄된 강의 노트를 디지털화해 나중에 전체 검색이 가능하게 만들기.

결과

식당 영수증 사진을 업로드하면 OCR이 '시저 샐러드 — 12,500원', '탄산수 — 3,000원'처럼 한 줄씩 읽어, 스프레드시트에 바로 붙여넣을 수 있는 깔끔한 텍스트로 돌려줍니다.

자주 묻는 질문

OCR 엔진은 어떤 언어를 인식하나요?
영어, 스페인어, 프랑스어, 독일어, 이탈리아어, 네덜란드어, 포르투갈어, 폴란드어, 스웨덴어, 터키어, 러시아어, 아랍어, 힌디어, 태국어, 베트남어, 중국어 간체/번체, 일본어, 한국어, 인도네시아어까지 모두 20개를 지원합니다. 이미지와 가장 비슷한 언어를 고르세요. 다국어 혼합 텍스트라면 가장 많은 비중을 차지하는 문자 체계를 고르면 좋습니다.
어느 정도 정확도를 기대할 수 있나요?
300 dpi 이상의 깔끔한 인쇄물(스크린샷, 스캔 PDF)에서는 대체로 95% 이상입니다. 손글씨, 낮은 대비, 흔들림, 비뚤어진 사진에서는 정확도가 크게 떨어집니다. 결과 옆 신뢰도 점수가 Tesseract의 확신 정도를 알려 줍니다.
왜 처음 언어를 바꿀 때 몇 초가 걸리나요?
Tesseract의 각 언어 모델은 10~20 MB 정도라서 그 언어를 처음 선택할 때 다운로드됩니다. 이후에는 브라우저 캐시에 남아 같은 언어로 다시 인식할 때는 거의 즉시 시작됩니다.
파일 업로드 대신 클립보드에서 스크린샷을 붙여 넣을 수 있나요?
가능합니다. Win+Shift+S(윈도) 또는 Cmd+Ctrl+Shift+4(맥)로 캡처한 뒤 ‘이미지 붙여넣기’를 누르세요. 도구는 클립보드에서 바로 읽으며 디스크에 저장하지 않습니다.
내 이미지가 서버로 전송되나요?
아닙니다. Tesseract는 WebAssembly로 페이지 내부에서만 동작하고, 이미지 바이트는 기기를 벗어나지 않습니다. 개발자 도구에서 네트워크를 끄고도 인식이 정상적으로 완료되는 것을 확인할 수 있습니다.

관련 도구