Penukar khusus · berjalan 100% dalam penyemak imbas anda
PDF ke PDF OCR yang Boleh Dicari
Tambahkan lapisan teks OCR yang tidak kelihatan pada PDF yang diimbas supaya ia menjadi boleh dicari + diindeks sambil mengekalkan imej halaman asal. Setiap halaman dipaparkan, OCR'd dan dibina semula dengan teks diletakkan di atas imej pada koordinat yang betul. Output ialah PDF standard yang dibuka dalam mana-mana pembaca.
Cara menggunakan
- Lepaskan fail PDF anda.
- Pilih bahasa dokumen daripada menu lungsur.
- Tesseract.js memuatkan data bahasa (~10 MB setiap bahasa, dicache selepas penggunaan pertama).
- OCR berjalan secara setempat dan output PDF Boleh Dicari ditawarkan untuk dimuat turun.
Soalan Lazim
Sejauh manakah ketepatan OCR?
Tesseract ialah salah satu enjin OCR sumber terbuka terbaik. Untuk teks moden yang bersih, ia biasanya 95-99% tepat. Tulisan tangan, imbasan kontras rendah atau fon luar biasa boleh menurunkan ketepatan dengan ketara.
Mengapakah penukaran pertama mengambil sedikit masa?
Larian pertama memuat turun ~10-15 MB data bahasa. Selepas itu ia di-cache untuk baki sesi anda.
Adakah dokumen atau imej saya dimuat naik ke pelayan?
Tidak. Penukaran berjalan sepenuhnya dalam penyemak imbas anda menggunakan WebAssembly dan API Web. Buka tab Rangkaian dalam DevTools semasa anda menukar — anda tidak akan melihat trafik keluar yang membawa fail anda.
Adakah ini benar-benar percuma?
Ya. Tiada pendaftaran, tiada kuota, tiada peringkat naik taraf. Penukaran dijalankan pada mesin anda, jadi kami tidak memerlukan sebarang bayaran untuk mengehoskan.