Penukar khusus · berjalan 100% dalam penyemak imbas anda

PDF ke PDF OCR yang Boleh Dicari

Tambahkan lapisan teks OCR yang tidak kelihatan pada PDF yang diimbas supaya ia menjadi boleh dicari + diindeks sambil mengekalkan imej halaman asal. Setiap halaman dipaparkan, OCR'd dan dibina semula dengan teks diletakkan di atas imej pada koordinat yang betul. Output ialah PDF standard yang dibuka dalam mana-mana pembaca.

Tiada muat naikTiada pendaftaranTiada penjejakanPercuma, tidak terhad
Letakkan fail PDF anda di sini
atau klik untuk memilih fail

Cara menggunakan

  1. Lepaskan fail PDF anda.
  2. Pilih bahasa dokumen daripada menu lungsur.
  3. Tesseract.js memuatkan data bahasa (~10 MB setiap bahasa, dicache selepas penggunaan pertama).
  4. OCR berjalan secara setempat dan output PDF Boleh Dicari ditawarkan untuk dimuat turun.

Soalan Lazim

Sejauh manakah ketepatan OCR?

Tesseract ialah salah satu enjin OCR sumber terbuka terbaik. Untuk teks moden yang bersih, ia biasanya 95-99% tepat. Tulisan tangan, imbasan kontras rendah atau fon luar biasa boleh menurunkan ketepatan dengan ketara.

Mengapakah penukaran pertama mengambil sedikit masa?

Larian pertama memuat turun ~10-15 MB data bahasa. Selepas itu ia di-cache untuk baki sesi anda.

Adakah dokumen atau imej saya dimuat naik ke pelayan?

Tidak. Penukaran berjalan sepenuhnya dalam penyemak imbas anda menggunakan WebAssembly dan API Web. Buka tab Rangkaian dalam DevTools semasa anda menukar — anda tidak akan melihat trafik keluar yang membawa fail anda.

Adakah ini benar-benar percuma?

Ya. Tiada pendaftaran, tiada kuota, tiada peringkat naik taraf. Penukaran dijalankan pada mesin anda, jadi kami tidak memerlukan sebarang bayaran untuk mengehoskan.