Kigeuzi maalum · huendesha 100% katika kivinjari chako

PDF hadi TXT OCR

Toa maandishi kutoka kwa PDF iliyochanganuliwa au kulingana na picha kwa kutumia OCR (Tesseract.js + pdf.js). Kila ukurasa hutolewa kwa turubai na OCR'd. Hufanya kazi kwa hati ambapo maandishi hayawezi kuchaguliwa. Maendeleo ya kurasa nyingi huonyeshwa kadiri ubadilishaji unavyoendelea.

Hakuna upakiajiHakuna kujisajiliHakuna ufuatiliajiBila malipo, bila kikomo
Dondosha faili yako ya PDF hapa
au bofya ili kuchagua faili

Jinsi ya kutumia

  1. Dondosha faili yako ya PDF.
  2. Chagua lugha ya hati kutoka kwenye menyu kunjuzi.
  3. Tesseract.js hupakia data ya lugha (~MB 10 kwa kila lugha, iliyohifadhiwa baada ya matumizi ya kwanza).
  4. OCR inaendeshwa ndani ya nchi na pato la TXT hutolewa kwa upakuaji.

Maswali Yanayoulizwa Mara kwa Mara

OCR ni sahihi kwa kiasi gani?

Tesseract ni mojawapo ya injini bora za chanzo huria za OCR. Kwa maandishi safi, ya kisasa kwa kawaida ni sahihi 95-99%. Mwandiko, uchanganuzi wa utofautishaji wa chini, au fonti zisizo za kawaida zinaweza kupunguza usahihi kwa kiasi kikubwa.

Kwa nini ubadilishaji wa kwanza huchukua muda?

Upakuaji wa kwanza ~ MB 10-15 ya data ya lugha. Baada ya hapo imehifadhiwa kwa muda wote wa kipindi chako.

Je, hati au picha yangu inapakia kwenye seva?

Hapana. Ubadilishaji unaendeshwa kabisa katika kivinjari chako kwa kutumia WebAssembly na API za Wavuti. Fungua kichupo cha Mtandao katika DevTools unapobadilisha - hutaona trafiki inayotoka nje iliyobeba faili yako.

Je, hii ni bure kweli?

Ndiyo. Hakuna kujisajili, hakuna nafasi, hakuna kiwango cha kuboresha. Ugeuzaji unatumia mashine yako, kwa hivyo haitugharimu chochote kuwapangisha.