Špecializovaný prevodník · beží 100% vo vašom prehliadači

PDF do prehľadávateľného PDF OCR

Pridajte do naskenovaného PDF neviditeľnú textovú vrstvu OCR, aby sa dal vyhľadávať + indexovať, pričom sa zachovali pôvodné obrázky strán. Každá stránka je vykreslená, OCR'd a prestavaná s textom položeným na obrázku so správnymi súradnicami. Výstupom je štandardné PDF, ktoré sa otvorí v akejkoľvek čítačke.

Žiadne nahrávanieŽiadna registráciaŽiadne sledovanieZadarmo, neobmedzene
Sem presuňte súbor PDF
alebo kliknutím vyberte súbor

Ako používať

  1. Zložte súbor PDF.
  2. Vyberte jazyk dokumentu z rozbaľovacej ponuky.
  3. Tesseract.js načítava jazykové údaje (~10 MB na jazyk, uložené vo vyrovnávacej pamäti po prvom použití).
  4. OCR beží lokálne a výstup PDF s možnosťou vyhľadávania je ponúkaný na stiahnutie. Prevodník

často kladené otázky

Ako presné je OCR?

Tesseract je jedným z najlepších OCR motorov s otvoreným zdrojom. Pre čistý a moderný text je to zvyčajne 95 – 99 % presnosť. Ručné písanie, skenovanie s nízkym kontrastom alebo nezvyčajné písma môžu výrazne znížiť presnosť.

Prečo prvá konverzia chvíľu trvá?

Prvé spustenie stiahne ~10-15 MB jazykových údajov. Potom sa uloží do vyrovnávacej pamäte pre zvyšok vašej relácie.

Odovzdáva sa môj dokument alebo obrázok na server?

Nie. Konverzia prebieha výlučne vo vašom prehliadači pomocou WebAssembly a Web API. Počas konverzie otvorte kartu Sieť v nástroji DevTools – neuvidíte žiadnu odchádzajúce prenosy prenášané vaším súborom.

Je to naozaj zadarmo?

Áno. Žiadna registrácia, žiadna kvóta, žiadna úroveň inovácie. Konverzia beží na vašom počítači, takže hosťovanie nás nič nestojí.