ప్రత్యేక కన్వర్టర్ · మీ బ్రౌజర్‌లో 100% రన్ అవుతుంది

PDF నుండి శోధించదగిన PDF OCR

స్కాన్ చేసిన PDFకి ఒక అదృశ్య OCR టెక్స్ట్ లేయర్‌ని జోడించండి, తద్వారా ఇది అసలు పేజీ చిత్రాలను ఉంచేటప్పుడు శోధించదగిన + సూచికగా మారుతుంది. ప్రతి పేజీ సరైన కోఆర్డినేట్‌ల వద్ద చిత్రంపై వేయబడిన వచనంతో రెండర్ చేయబడింది, OCR చేయబడింది మరియు పునర్నిర్మించబడింది. అవుట్‌పుట్ అనేది ఏదైనా రీడర్‌లో తెరవబడే ప్రామాణిక PDF.

అప్‌లోడ్ లేదుసైన్అప్ లేదుట్రాకింగ్ లేదుఉచిత, అపరిమిత
మీ PDF ఫైల్‌ను ఇక్కడ వదలండి
లేదా ఫైల్‌ని ఎంచుకోవడానికి క్లిక్ చేయండి

ఎలా ఉపయోగించాలి

  1. మీ PDF ఫైల్‌ను వదలండి.
  2. డ్రాప్‌డౌన్ నుండి పత్రం యొక్క భాషను ఎంచుకోండి.
  3. Tesseract.js భాష డేటాను లోడ్ చేస్తుంది (ఒక భాషకు ~10 MB, మొదటి ఉపయోగం తర్వాత కాష్ చేయబడింది).
  4. OCR స్థానికంగా నడుస్తుంది మరియు డౌన్‌లోడ్ కోసం శోధించదగిన PDF అవుట్‌పుట్ అందించబడుతుంది.

తరచుగా అడిగే ప్రశ్నలు

OCR ఎంత ఖచ్చితమైనది?

టెస్సెరాక్ట్ అత్యుత్తమ ఓపెన్ సోర్స్ OCR ఇంజిన్‌లలో ఒకటి. శుభ్రమైన, ఆధునిక వచనం కోసం ఇది సాధారణంగా 95-99% ఖచ్చితమైనది. చేతివ్రాత, తక్కువ-కాంట్రాస్ట్ స్కాన్‌లు లేదా అసాధారణ ఫాంట్‌లు ఖచ్చితత్వాన్ని గణనీయంగా తగ్గించగలవు.

మొదటి మార్పిడికి కొంత సమయం ఎందుకు పడుతుంది?

మొదటి రన్ డౌన్‌లోడ్ ~10-15 MB భాషా డేటా. ఆ తర్వాత అది మీ మిగిలిన సెషన్‌లో కాష్ చేయబడుతుంది.

నా పత్రం లేదా చిత్రం సర్వర్‌కి అప్‌లోడ్ అవుతుందా?

సంఖ్య. మార్పిడి పూర్తిగా WebAssembly మరియు Web APIలను ఉపయోగించి మీ బ్రౌజర్‌లో నడుస్తుంది. మీరు మార్చేటప్పుడు DevToolsలో నెట్‌వర్క్ ట్యాబ్‌ను తెరవండి — మీ ఫైల్‌ని తీసుకువెళ్లే అవుట్‌బౌండ్ ట్రాఫిక్ మీకు కనిపించదు.

ఇది నిజంగా ఉచితం?

అవును. సైన్అప్ లేదు, కోటా లేదు, అప్‌గ్రేడ్ టైర్ లేదు. మార్పిడి మీ మెషీన్‌లో నడుస్తుంది, కాబట్టి హోస్ట్ చేయడానికి మాకు ఎటువంటి ఖర్చు ఉండదు.