Konverter khusus · berjalan 100% di browser Anda
OCR PDF ke TXT
Ekstrak teks dari PDF hasil pindaian atau berbasis gambar menggunakan OCR (Tesseract.js + pdf.js). Setiap halaman dirender ke canvas dan di-OCR. Berfungsi untuk dokumen yang teksnya tidak dapat dipilih. Progres multi-halaman ditampilkan selama konversi berlangsung.
Cara penggunaan
- Letakkan file PDF Anda.
- Pilih bahasa dokumen dari dropdown.
- Tesseract.js memuat data bahasa (~10 MB per bahasa, di-cache setelah penggunaan pertama).
- OCR berjalan secara lokal dan output TXT ditawarkan untuk diunduh.
FAQ
Seberapa akurat OCR-nya?
Tesseract adalah salah satu mesin OCR open-source terbaik. Untuk teks modern yang bersih, akurasinya biasanya 95–99%. Tulisan tangan, pindaian kontras rendah, atau font yang tidak biasa dapat menurunkan akurasi secara signifikan.
Mengapa konversi pertama membutuhkan waktu lama?
Eksekusi pertama mengunduh ~10–15 MB data bahasa. Setelah itu, data di-cache untuk sisa sesi Anda.
Apakah dokumen atau gambar saya diunggah ke server?
Tidak. Konversi berjalan sepenuhnya di browser Anda menggunakan WebAssembly dan Web API. Buka tab Jaringan di DevTools saat Anda mengonversi — Anda tidak akan melihat lalu lintas keluar yang membawa file Anda.
Apakah ini benar-benar gratis?
Ya. Tanpa daftar, tanpa kuota, tanpa tingkatan berbayar. Konversi berjalan di mesin Anda, sehingga tidak ada biaya bagi kami untuk meng-host-nya.