Mai canzawa na musamman · yana aiki 100% a cikin burauzar ku
PDF zuwa TXT OCR
Cire rubutu daga PDF ɗin da aka bincika ko tushen hoto ta amfani da OCR (Tesseract.js + pdf.js). Ana yin kowane shafi zuwa zane da OCR'd. Yana aiki don takaddun inda rubutun ba za'a iya zaɓa ba. Ana nuna ci gaban shafuka da yawa yayin da juyawa ke gudana.
Yadda ake amfani da shi
- Ajiye fayil ɗin PDF ɗinku.
- Zaɓi yaren daftarin aiki daga zazzagewa.
- Tesseract.js yana loda bayanan harshe (~ 10 MB kowane harshe, cache bayan amfani da farko).
- OCR yana gudana a cikin gida kuma ana ba da fitar da TXT don saukewa.
FAQ
Yaya daidai ne OCR?
Tesseract yana ɗaya daga cikin mafi kyawun injunan OCR na buɗe ido. Don tsabta, rubutu na zamani yawanci daidai 95-99%. Rubutun hannu, ƙananan sikanin bambance-bambance, ko manyan haruffa na iya sauke daidaito sosai.
Me yasa tuba ta farko ke ɗaukar ɗan lokaci?
Zazzagewar farko ~10-15 MB na bayanan harshe. Bayan haka an adana shi don sauran zaman ku.
Shin takaddara ko hotona na loda zuwa uwar garken?
A'a. Juyawa yana gudana gaba ɗaya a cikin burauzar ku ta amfani da WebAssembly da APIs na Yanar Gizo. Bude shafin hanyar sadarwa a cikin DevTools yayin da kuke juyawa - ba za ku ga zirga-zirga mai fita da ke ɗauke da fayil ɗin ku ba.
Wannan da gaske ne kyauta?
Iya. Babu rajista, babu rabo, babu matakin haɓakawa. Juyawa yana gudana akan injin ku, don haka ba ya kashe mana komai don karbar bakuncin.