சிறப்பு மாற்றி · உங்கள் உலாவியில் 100% இயங்குகிறது

PDF முதல் TXT OCR வரை

OCR (Tesseract.js + pdf.js) ஐப் பயன்படுத்தி ஸ்கேன் செய்யப்பட்ட அல்லது பட அடிப்படையிலான PDF இலிருந்து உரையைப் பிரித்தெடுக்கவும். ஒவ்வொரு பக்கமும் ஒரு கேன்வாஸுக்கு ரெண்டர் செய்யப்பட்டு OCR'd. உரை தேர்ந்தெடுக்க முடியாத ஆவணங்களுக்கு வேலை செய்கிறது. மாற்றம் இயங்கும்போது பல பக்க முன்னேற்றம் காட்டப்படுகிறது.

பதிவேற்றம் இல்லைபதிவு இல்லைகண்காணிப்பு இல்லைஇலவசம், வரம்பற்றது
உங்கள் PDF கோப்பை இங்கே விடவும்
அல்லது கோப்பைத் தேர்ந்தெடுக்க கிளிக் செய்யவும்

எப்படி பயன்படுத்துவது

  1. உங்கள் PDF கோப்பை கைவிடவும்.
  2. கீழ்தோன்றலில் இருந்து ஆவணத்தின் மொழியைத் தேர்ந்தெடுக்கவும்.
  3. Tesseract.js மொழித் தரவை ஏற்றுகிறது (ஒரு மொழிக்கு ~10 MB, முதல் பயன்பாட்டிற்குப் பிறகு தற்காலிக சேமிப்பு).
  4. OCR உள்நாட்டில் இயங்குகிறது மற்றும் TXT வெளியீடு பதிவிறக்கத்திற்கு வழங்கப்படுகிறது.

அடிக்கடி கேட்கப்படும் கேள்விகள்

OCR எவ்வளவு துல்லியமானது?

Tesseract சிறந்த திறந்த மூல OCR இன்ஜின்களில் ஒன்றாகும். சுத்தமான, நவீன உரைக்கு பொதுவாக 95-99% துல்லியமாக இருக்கும். கையெழுத்து, குறைந்த மாறுபாடு ஸ்கேன் அல்லது அசாதாரண எழுத்துருக்கள் துல்லியத்தை கணிசமாகக் குறைக்கலாம்.

முதல் மாற்றத்திற்கு ஏன் சிறிது நேரம் ஆகும்?

முதல் ரன் ~10-15 MB மொழித் தரவைப் பதிவிறக்குகிறது. அதன் பிறகு, உங்கள் அமர்வின் எஞ்சிய பகுதிக்கு இது தற்காலிகமாக சேமிக்கப்படும்.

எனது ஆவணம் அல்லது படம் சர்வரில் பதிவேற்றப்படுகிறதா?

எண். மாற்றம் உங்கள் உலாவியில் WebAssembly மற்றும் Web APIகளைப் பயன்படுத்தி முழுமையாக இயங்கும். நீங்கள் மாற்றும் போது DevTools இல் நெட்வொர்க் தாவலைத் திறக்கவும் - உங்கள் கோப்பை எடுத்துச் செல்லும் வெளிச்செல்லும் போக்குவரத்தை நீங்கள் காண மாட்டீர்கள்.

இது உண்மையில் இலவசமா?

ஆம். பதிவு இல்லை, ஒதுக்கீடு இல்லை, மேம்படுத்தல் அடுக்கு இல்லை. மாற்றம் உங்கள் கணினியில் இயங்குகிறது, எனவே ஹோஸ்ட் செய்ய எங்களுக்கு எதுவும் செலவாகாது.