전문 변환기 · 브라우저에서 100% 실행
PDF를 TXT OCR로
OCR(Tesseract.js + pdf.js)을 사용하여 스캔한 PDF 또는 이미지 기반 PDF에서 텍스트를 추출합니다. 각 페이지는 캔버스로 렌더링되고 OCR됩니다. 텍스트를 선택할 수 없는 문서에 작동합니다. 변환이 실행되면서 여러 페이지의 진행 상황이 표시됩니다.
업로드 없음가입 없음추적 없음무료, 무제한
PDF 파일을 여기에 드롭하세요
또는 클릭하여 파일을 선택하세요.
사용 방법
- PDF 파일을 끌어다 놓기하세요.
- 드롭다운에서 문서의 언어를 선택하세요.
- Tesseract.js는 언어 데이터(언어당 최대 10MB, 처음 사용 후 캐시됨)를 로드합니다.
- OCR은 로컬로 실행되며 TXT 출력은 다운로드용으로 제공됩니다.
FAQ
OCR은 얼마나 정확합니까?
Tesseract는 최고의 오픈 소스 OCR 엔진 중 하나입니다. 깨끗하고 현대적인 텍스트의 경우 일반적으로 95-99% 정확합니다. 필기, 저대비 스캔 또는 특이한 글꼴은 정확성을 크게 떨어뜨릴 수 있습니다.
첫 번째 변환에 시간이 걸리는 이유는 무엇입니까?
첫 번째 실행에서는 ~10-15MB의 언어 데이터를 다운로드합니다. 그 후에는 나머지 세션 동안 캐시됩니다.
내 문서나 이미지가 서버에 업로드되나요?
아니요. 변환은 WebAssembly 및 Web API를 사용하여 브라우저에서 전적으로 실행됩니다. 변환하는 동안 DevTools에서 네트워크 탭을 엽니다. 파일을 전달하는 아웃바운드 트래픽이 표시되지 않습니다.
이게 정말 무료인가요?
네. 가입도, 할당량도, 업그레이드 계층도 없습니다. 변환은 귀하의 컴퓨터에서 실행되므로 호스팅하는 데 비용이 들지 않습니다.