Mai canzawa na musamman · yana aiki 100% a cikin burauzar ku
PDF zuwa PDF OCR da ake nema
Ƙara wani rubutu na OCR mara ganuwa zuwa PDF ɗin da aka duba don haka ya zama abin nema + wanda za'a iya amfani dashi yayin adana hotunan shafin na asali. Ana yin kowane shafi, OCR'd, kuma an sake gina shi tare da rubutun da aka ɗora kan hoton a daidaitattun daidaitawa. Output daidaitaccen PDF ne wanda ke buɗewa a kowane mai karatu.
Yadda ake amfani da shi
- Ajiye fayil ɗin PDF ɗinku.
- Zaɓi yaren daftarin aiki daga zazzagewa.
- Tesseract.js yana loda bayanan harshe (~ 10 MB kowane harshe, cache bayan amfani da farko).
- OCR yana gudana a cikin gida kuma ana ba da kayan aikin PDF da ake nema don saukewa.
FAQ
Yaya daidai ne OCR?
Tesseract yana ɗaya daga cikin mafi kyawun injunan OCR na buɗe ido. Don tsabta, rubutu na zamani yawanci daidai 95-99%. Rubutun hannu, ƙananan sikanin bambance-bambance, ko manyan haruffa na iya sauke daidaito sosai.
Me yasa tuba ta farko ke ɗaukar ɗan lokaci?
Zazzagewar farko ~10-15 MB na bayanan harshe. Bayan haka an adana shi don sauran zaman ku.
Shin takaddara ko hotona na loda zuwa uwar garken?
A'a. Juyawa yana gudana gaba ɗaya a cikin burauzar ku ta amfani da WebAssembly da APIs na Yanar Gizo. Bude shafin hanyar sadarwa a cikin DevTools yayin da kuke juyawa - ba za ku ga zirga-zirga mai fita da ke ɗauke da fayil ɗin ku ba.
Wannan da gaske ne kyauta?
Iya. Babu rajista, babu rabo, babu matakin haɓakawa. Juyawa yana gudana akan injin ku, don haka ba ya kashe mana komai don karbar bakuncin.