Penukar khusus · berjalan 100% dalam penyemak imbas anda
PDF ke TXT OCR
Ekstrak teks daripada PDF yang diimbas atau berasaskan imej menggunakan OCR (Tesseract.js + pdf.js). Setiap halaman dipaparkan kepada kanvas dan OCR'd. Berfungsi untuk dokumen yang teksnya tidak boleh dipilih. Kemajuan berbilang halaman ditunjukkan semasa penukaran berjalan.
Cara menggunakan
- Lepaskan fail PDF anda.
- Pilih bahasa dokumen daripada menu lungsur.
- Tesseract.js memuatkan data bahasa (~10 MB setiap bahasa, dicache selepas penggunaan pertama).
- OCR berjalan secara tempatan dan output TXT ditawarkan untuk dimuat turun.
Soalan Lazim
Sejauh manakah ketepatan OCR?
Tesseract ialah salah satu enjin OCR sumber terbuka terbaik. Untuk teks moden yang bersih, ia biasanya 95-99% tepat. Tulisan tangan, imbasan kontras rendah atau fon luar biasa boleh menurunkan ketepatan dengan ketara.
Mengapakah penukaran pertama mengambil sedikit masa?
Larian pertama memuat turun ~10-15 MB data bahasa. Selepas itu ia di-cache untuk baki sesi anda.
Adakah dokumen atau imej saya dimuat naik ke pelayan?
Tidak. Penukaran berjalan sepenuhnya dalam penyemak imbas anda menggunakan WebAssembly dan API Web. Buka tab Rangkaian dalam DevTools semasa anda menukar — anda tidak akan melihat trafik keluar yang membawa fail anda.
Adakah ini benar-benar percuma?
Ya. Tiada pendaftaran, tiada kuota, tiada peringkat naik taraf. Penukaran dijalankan pada mesin anda, jadi kami tidak memerlukan sebarang bayaran untuk mengehoskan.