Penukar khusus · berjalan 100% dalam penyemak imbas anda

PDF ke TXT OCR

Ekstrak teks daripada PDF yang diimbas atau berasaskan imej menggunakan OCR (Tesseract.js + pdf.js). Setiap halaman dipaparkan kepada kanvas dan OCR'd. Berfungsi untuk dokumen yang teksnya tidak boleh dipilih. Kemajuan berbilang halaman ditunjukkan semasa penukaran berjalan.

Tiada muat naikTiada pendaftaranTiada penjejakanPercuma, tidak terhad
Letakkan fail PDF anda di sini
atau klik untuk memilih fail

Cara menggunakan

  1. Lepaskan fail PDF anda.
  2. Pilih bahasa dokumen daripada menu lungsur.
  3. Tesseract.js memuatkan data bahasa (~10 MB setiap bahasa, dicache selepas penggunaan pertama).
  4. OCR berjalan secara tempatan dan output TXT ditawarkan untuk dimuat turun.

Soalan Lazim

Sejauh manakah ketepatan OCR?

Tesseract ialah salah satu enjin OCR sumber terbuka terbaik. Untuk teks moden yang bersih, ia biasanya 95-99% tepat. Tulisan tangan, imbasan kontras rendah atau fon luar biasa boleh menurunkan ketepatan dengan ketara.

Mengapakah penukaran pertama mengambil sedikit masa?

Larian pertama memuat turun ~10-15 MB data bahasa. Selepas itu ia di-cache untuk baki sesi anda.

Adakah dokumen atau imej saya dimuat naik ke pelayan?

Tidak. Penukaran berjalan sepenuhnya dalam penyemak imbas anda menggunakan WebAssembly dan API Web. Buka tab Rangkaian dalam DevTools semasa anda menukar — anda tidak akan melihat trafik keluar yang membawa fail anda.

Adakah ini benar-benar percuma?

Ya. Tiada pendaftaran, tiada kuota, tiada peringkat naik taraf. Penukaran dijalankan pada mesin anda, jadi kami tidak memerlukan sebarang bayaran untuk mengehoskan.