전문 변환기 · 브라우저에서 100% 실행

PDF → TXT OCR

OCR(Tesseract.js + pdf.js)을 사용하여 스캔된 이미지 기반 PDF에서 텍스트를 추출합니다. 각 페이지가 Canvas에 렌더링되고 OCR 처리됩니다. 텍스트를 선택할 수 없는 문서에 사용합니다. 변환이 실행되는 동안 다중 페이지 진행 상황이 표시됩니다.

업로드 없음가입 없음추적 없음무료, 무제한
여기에 PDF 파일을 놓으세요
또는 클릭하여 파일 선택

사용 방법

  1. PDF 파일을 여기에 놓으세요.
  2. 드롭다운에서 문서의 언어를 선택하세요.
  3. Tesseract.js가 언어 데이터를 로드합니다 (언어당 약 10 MB, 첫 사용 후 캐시됨).
  4. OCR이 로컬에서 실행되고 TXT 출력이 다운로드로 제공됩니다.

자주 묻는 질문

OCR 정확도는 어느 정도인가요?

Tesseract는 최고의 오픈 소스 OCR 엔진 중 하나입니다. 깔끔하고 현대적인 텍스트의 경우 일반적으로 95~99% 정확합니다. 손글씨, 대비가 낮은 스캔, 특이한 폰트의 경우 정확도가 크게 떨어질 수 있습니다.

첫 번째 변환이 왜 시간이 걸리나요?

첫 실행 시 약 10~15 MB의 언어 데이터가 다운로드됩니다. 이후에는 세션 중 캐시됩니다.

문서나 이미지가 서버에 업로드되나요?

아니요. 변환은 WebAssembly와 Web API를 사용해 브라우저에서 완전히 실행됩니다. 변환하는 동안 DevTools의 Network 탭을 열어 확인해 보세요 — 파일을 전송하는 아웃바운드 트래픽이 없습니다.

정말 무료인가요?

네. 회원가입, 할당량, 업그레이드 티어가 없습니다. 변환이 내 기기에서 실행되므로 호스팅 비용도 들지 않습니다.