Konverter khusus · berjalan 100% di browser Anda

OCR PDF ke TXT

Ekstrak teks dari PDF hasil pindaian atau berbasis gambar menggunakan OCR (Tesseract.js + pdf.js). Setiap halaman dirender ke canvas dan di-OCR. Berfungsi untuk dokumen yang teksnya tidak dapat dipilih. Progres multi-halaman ditampilkan selama konversi berlangsung.

Tanpa uploadTanpa daftarTanpa pelacakanGratis, tak terbatas
Letakkan file PDF Anda di sini
atau klik untuk memilih file

Cara penggunaan

  1. Letakkan file PDF Anda.
  2. Pilih bahasa dokumen dari dropdown.
  3. Tesseract.js memuat data bahasa (~10 MB per bahasa, di-cache setelah penggunaan pertama).
  4. OCR berjalan secara lokal dan output TXT ditawarkan untuk diunduh.

FAQ

Seberapa akurat OCR-nya?

Tesseract adalah salah satu mesin OCR open-source terbaik. Untuk teks modern yang bersih, akurasinya biasanya 95–99%. Tulisan tangan, pindaian kontras rendah, atau font yang tidak biasa dapat menurunkan akurasi secara signifikan.

Mengapa konversi pertama membutuhkan waktu lama?

Eksekusi pertama mengunduh ~10–15 MB data bahasa. Setelah itu, data di-cache untuk sisa sesi Anda.

Apakah dokumen atau gambar saya diunggah ke server?

Tidak. Konversi berjalan sepenuhnya di browser Anda menggunakan WebAssembly dan Web API. Buka tab Jaringan di DevTools saat Anda mengonversi — Anda tidak akan melihat lalu lintas keluar yang membawa file Anda.

Apakah ini benar-benar gratis?

Ya. Tanpa daftar, tanpa kuota, tanpa tingkatan berbayar. Konversi berjalan di mesin Anda, sehingga tidak ada biaya bagi kami untuk meng-host-nya.