Mai canzawa na musamman · yana aiki 100% a cikin burauzar ku

PDF zuwa PDF OCR da ake nema

Ƙara wani rubutu na OCR mara ganuwa zuwa PDF ɗin da aka duba don haka ya zama abin nema + wanda za'a iya amfani dashi yayin adana hotunan shafin na asali. Ana yin kowane shafi, OCR'd, kuma an sake gina shi tare da rubutun da aka ɗora kan hoton a daidaitattun daidaitawa. Output daidaitaccen PDF ne wanda ke buɗewa a kowane mai karatu.

Babu lodawaBabu rajistaBabu bin diddigiKyauta, mara iyaka
Ajiye fayil ɗin PDF ɗinku anan
ko danna don zaɓar fayil

Yadda ake amfani da shi

  1. Ajiye fayil ɗin PDF ɗinku.
  2. Zaɓi yaren daftarin aiki daga zazzagewa.
  3. Tesseract.js yana loda bayanan harshe (~ 10 MB kowane harshe, cache bayan amfani da farko).
  4. OCR yana gudana a cikin gida kuma ana ba da kayan aikin PDF da ake nema don saukewa.

FAQ

Yaya daidai ne OCR?

Tesseract yana ɗaya daga cikin mafi kyawun injunan OCR na buɗe ido. Don tsabta, rubutu na zamani yawanci daidai 95-99%. Rubutun hannu, ƙananan sikanin bambance-bambance, ko manyan haruffa na iya sauke daidaito sosai.

Me yasa tuba ta farko ke ɗaukar ɗan lokaci?

Zazzagewar farko ~10-15 MB na bayanan harshe. Bayan haka an adana shi don sauran zaman ku.

Shin takaddara ko hotona na loda zuwa uwar garken?

A'a. Juyawa yana gudana gaba ɗaya a cikin burauzar ku ta amfani da WebAssembly da APIs na Yanar Gizo. Bude shafin hanyar sadarwa a cikin DevTools yayin da kuke juyawa - ba za ku ga zirga-zirga mai fita da ke ɗauke da fayil ɗin ku ba.

Wannan da gaske ne kyauta?

Iya. Babu rajista, babu rabo, babu matakin haɓakawa. Juyawa yana gudana akan injin ku, don haka ba ya kashe mana komai don karbar bakuncin.