Špecializovaný prevodník · beží 100% vo vašom prehliadači
PDF do prehľadávateľného PDF OCR
Pridajte do naskenovaného PDF neviditeľnú textovú vrstvu OCR, aby sa dal vyhľadávať + indexovať, pričom sa zachovali pôvodné obrázky strán. Každá stránka je vykreslená, OCR'd a prestavaná s textom položeným na obrázku so správnymi súradnicami. Výstupom je štandardné PDF, ktoré sa otvorí v akejkoľvek čítačke.
Ako používať
- Zložte súbor PDF.
- Vyberte jazyk dokumentu z rozbaľovacej ponuky.
- Tesseract.js načítava jazykové údaje (~10 MB na jazyk, uložené vo vyrovnávacej pamäti po prvom použití).
- OCR beží lokálne a výstup PDF s možnosťou vyhľadávania je ponúkaný na stiahnutie. Prevodník
často kladené otázky
Ako presné je OCR?
Tesseract je jedným z najlepších OCR motorov s otvoreným zdrojom. Pre čistý a moderný text je to zvyčajne 95 – 99 % presnosť. Ručné písanie, skenovanie s nízkym kontrastom alebo nezvyčajné písma môžu výrazne znížiť presnosť.
Prečo prvá konverzia chvíľu trvá?
Prvé spustenie stiahne ~10-15 MB jazykových údajov. Potom sa uloží do vyrovnávacej pamäte pre zvyšok vašej relácie.
Odovzdáva sa môj dokument alebo obrázok na server?
Nie. Konverzia prebieha výlučne vo vašom prehliadači pomocou WebAssembly a Web API. Počas konverzie otvorte kartu Sieť v nástroji DevTools – neuvidíte žiadnu odchádzajúce prenosy prenášané vaším súborom.
Je to naozaj zadarmo?
Áno. Žiadna registrácia, žiadna kvóta, žiadna úroveň inovácie. Konverzia beží na vašom počítači, takže hosťovanie nás nič nestojí.