Speciális konverter · 100%-ban fut a böngészőjében

PDF - Kereshető PDF OCR

Adjon hozzá egy láthatatlan OCR-szövegréteget a beolvasott PDF-hez, így az kereshetővé és indexelhetővé válik, miközben az eredeti oldal képei megmaradnak. Minden oldal renderelésre, OCR-re és újjáépítésre kerül úgy, hogy a szöveg a kép fölé kerül a megfelelő koordinátákon. A kimenet egy szabványos PDF, amely bármely olvasóban megnyílik.

Nincs feltöltésNincs regisztrációNincs követésIngyenes, korlátlan
Dobja ide a PDF-fájlt
vagy kattintson a fájl kiválasztásához

Hogyan kell használni

  1. Dobja el a PDF-fájlt.
  2. Válassza ki a dokumentum nyelvét a legördülő menüből.
  3. A Tesseract.js betölti a nyelvi adatokat (nyelvenként kb. 10 MB, az első használat után gyorsítótárban).
  4. Az OCR helyileg fut, és a kereshető PDF kimenet letölthető.

GYIK

Mennyire pontos az OCR?

A Tesseract az egyik legjobb nyílt forráskódú OCR motor. Tiszta, modern szöveg esetén általában 95-99%-os pontosságú. A kézírás, az alacsony kontrasztú szkennelés vagy a szokatlan betűtípusok jelentősen csökkenthetik a pontosságot.

Miért tart sokáig az első konverzió?

Az első futtatás ~10-15 MB nyelvi adatot tölt le. Ezt követően a munkamenet hátralévő részében gyorsítótárban lesz.

Feltöltődik a dokumentumom vagy a képem a szerverre?

Nem. A konvertálás teljes egészében az Ön böngészőjében fut a WebAssembly és a Web API-k használatával. Nyissa meg a DevTools Hálózat lapját konvertálás közben – nem fog látni a fájlt továbbító kimenő forgalmat.

Ez tényleg ingyenes?

Igen. Nincs regisztráció, nincs kvóta, nincs frissítési szint. Az átalakítás az Ön gépén fut, tehát semmibe nem kerül a hosztolás.