Konverter khusus · berjalan 100% di browser Anda

PDF ke TXT OCR

Ekstrak teks dari PDF yang dipindai atau berbasis gambar menggunakan OCR (Tesseract.js + pdf.js). Setiap halaman dirender ke kanvas dan di OCR. Berfungsi untuk dokumen yang teksnya tidak dapat dipilih. Kemajuan multi-halaman ditampilkan saat konversi berjalan.

Tidak ada unggahanTidak ada pendaftaranTidak ada pelacakanGratis, tidak terbatas
Letakkan file PDF Anda di sini
atau klik untuk memilih file

Cara menggunakan

  1. Jatuhkan file PDF Anda.
  2. Pilih bahasa dokumen dari dropdown.
  3. Tesseract.js memuat data bahasa (~10 MB per bahasa, di-cache setelah penggunaan pertama).
  4. OCR berjalan secara lokal dan output TXT ditawarkan untuk diunduh.

Pertanyaan Umum

Seberapa akurat OCRnya?

Tesseract adalah salah satu mesin OCR sumber terbuka terbaik. Untuk teks yang bersih dan modern, biasanya akurasinya 95-99%. Tulisan tangan, pemindaian dengan kontras rendah, atau font yang tidak biasa dapat menurunkan akurasi secara signifikan.

Mengapa konversi pertama memerlukan waktu cukup lama?

Proses pertama mengunduh ~10-15 MB data bahasa. Setelah itu di-cache untuk sisa sesi Anda.

Apakah dokumen atau gambar saya diunggah ke server?

Tidak. Konversi berjalan sepenuhnya di browser Anda menggunakan WebAssembly dan Web API. Buka tab Jaringan di DevTools saat Anda melakukan konversi — Anda tidak akan melihat lalu lintas keluar yang membawa file Anda.

Apakah ini benar-benar gratis?

Ya. Tanpa pendaftaran, tanpa kuota, tanpa tingkat peningkatan. Konversi berjalan di mesin Anda, jadi kami tidak mengeluarkan biaya apa pun untuk menghostingnya.