Kigeuzi maalum · huendesha 100% katika kivinjari chako

PDF hadi OCR ya PDF Inayoweza kutafutwa

Ongeza safu ya maandishi ya OCR isiyoonekana kwenye PDF iliyochanganuliwa ili iweze kutafutwa + na indexable huku ukihifadhi picha za ukurasa asili. Kila ukurasa umetolewa, OCR'd, na kujengwa upya kwa maandishi yaliyowekwa juu ya picha kwenye viwianishi sahihi. Pato ni PDF ya kawaida ambayo hufunguliwa katika msomaji wowote.

Hakuna upakiajiHakuna kujisajiliHakuna ufuatiliajiBila malipo, bila kikomo
Dondosha faili yako ya PDF hapa
au bofya ili kuchagua faili

Jinsi ya kutumia

  1. Dondosha faili yako ya PDF.
  2. Chagua lugha ya hati kutoka kwenye menyu kunjuzi.
  3. Tesseract.js hupakia data ya lugha (~MB 10 kwa kila lugha, iliyohifadhiwa baada ya matumizi ya kwanza).
  4. OCR inaendeshwa ndani ya nchi na Toleo la PDF linalotafutwa hutolewa kwa upakuaji.

Maswali Yanayoulizwa Mara kwa Mara

OCR ni sahihi kwa kiasi gani?

Tesseract ni mojawapo ya injini bora za chanzo huria za OCR. Kwa maandishi safi, ya kisasa kwa kawaida ni sahihi 95-99%. Mwandiko, uchanganuzi wa utofautishaji wa chini, au fonti zisizo za kawaida zinaweza kupunguza usahihi kwa kiasi kikubwa.

Kwa nini ubadilishaji wa kwanza huchukua muda?

Upakuaji wa kwanza ~ MB 10-15 ya data ya lugha. Baada ya hapo imehifadhiwa kwa muda wote wa kipindi chako.

Je, hati au picha yangu inapakia kwenye seva?

Hapana. Ubadilishaji unaendeshwa kabisa katika kivinjari chako kwa kutumia WebAssembly na API za Wavuti. Fungua kichupo cha Mtandao katika DevTools unapobadilisha - hutaona trafiki inayotoka nje iliyobeba faili yako.

Je, hii ni bure kweli?

Ndiyo. Hakuna kujisajili, hakuna nafasi, hakuna kiwango cha kuboresha. Ugeuzaji unatumia mashine yako, kwa hivyo haitugharimu chochote kuwapangisha.