പ്രത്യേക കൺവെർട്ടർ · നിങ്ങളുടെ ബ്രൗസറിൽ 100% പ്രവർത്തിക്കുന്നു

PDF മുതൽ TXT OCR വരെ

OCR (Tesseract.js + pdf.js) ഉപയോഗിച്ച് സ്‌കാൻ ചെയ്‌ത അല്ലെങ്കിൽ ഇമേജ് അടിസ്ഥാനമാക്കിയുള്ള PDF-ൽ നിന്ന് ടെക്‌സ്‌റ്റ് എക്‌സ്‌ട്രാക്റ്റ് ചെയ്യുക. ഓരോ പേജും ഒരു ക്യാൻവാസിലേക്ക് റെൻഡർ ചെയ്യുകയും OCR'd ചെയ്യുകയും ചെയ്യുന്നു. ടെക്‌സ്‌റ്റ് തിരഞ്ഞെടുക്കാനാകാത്ത പ്രമാണങ്ങൾക്കായി പ്രവർത്തിക്കുന്നു. പരിവർത്തനം നടക്കുമ്പോൾ ഒന്നിലധികം പേജ് പുരോഗതി കാണിക്കുന്നു.

അപ്‌ലോഡ് ഇല്ലസൈൻഅപ്പ് ഇല്ലട്രാക്കിംഗ് ഇല്ലസൗജന്യം, പരിധിയില്ലാത്തത്
നിങ്ങളുടെ PDF ഫയൽ ഇവിടെ ഡ്രോപ്പ് ചെയ്യുക
അല്ലെങ്കിൽ ഒരു ഫയൽ തിരഞ്ഞെടുക്കാൻ ക്ലിക്ക് ചെയ്യുക

എങ്ങനെ ഉപയോഗിക്കാം

  1. നിങ്ങളുടെ PDF ഫയൽ ഡ്രോപ്പ് ചെയ്യുക.
  2. ഡ്രോപ്പ്ഡൗണിൽ നിന്ന് പ്രമാണത്തിൻ്റെ ഭാഷ തിരഞ്ഞെടുക്കുക.
  3. Tesseract.js ഭാഷാ ഡാറ്റ ലോഡ് ചെയ്യുന്നു (ഒരു ഭാഷയ്ക്ക് ~10 MB, ആദ്യ ഉപയോഗത്തിന് ശേഷം കാഷെ ചെയ്തു).
  4. OCR പ്രാദേശികമായി പ്രവർത്തിക്കുന്നു, കൂടാതെ TXT ഔട്ട്‌പുട്ട് ഡൗൺലോഡിനായി വാഗ്ദാനം ചെയ്യുന്നു.

പതിവുചോദ്യങ്ങൾ

OCR എത്ര കൃത്യമാണ്?

ടെസറാക്ട് മികച്ച ഓപ്പൺ സോഴ്‌സ് OCR എഞ്ചിനുകളിൽ ഒന്നാണ്. വൃത്തിയുള്ളതും ആധുനികവുമായ വാചകത്തിന് ഇത് സാധാരണയായി 95-99% കൃത്യമാണ്. കൈയക്ഷരം, കുറഞ്ഞ കോൺട്രാസ്റ്റ് സ്കാനുകൾ അല്ലെങ്കിൽ അസാധാരണമായ ഫോണ്ടുകൾ എന്നിവയ്ക്ക് കൃത്യത ഗണ്യമായി കുറയും.

എന്തുകൊണ്ടാണ് ആദ്യ പരിവർത്തനത്തിന് കുറച്ച് സമയമെടുക്കുന്നത്?

ആദ്യ റൺ ഡൗൺലോഡ് ചെയ്യുന്നു ~10-15 MB ഭാഷാ ഡാറ്റ. അതിനുശേഷം നിങ്ങളുടെ സെഷൻ്റെ ബാക്കി ഭാഗത്തേക്ക് ഇത് കാഷെ ചെയ്യപ്പെടും.

എൻ്റെ പ്രമാണമോ ചിത്രമോ ഒരു സെർവറിലേക്ക് അപ്‌ലോഡ് ചെയ്യുന്നുണ്ടോ?

നമ്പർ. WebAssembly, Web API-കൾ ഉപയോഗിച്ച് പരിവർത്തനം പൂർണ്ണമായും നിങ്ങളുടെ ബ്രൗസറിൽ പ്രവർത്തിക്കുന്നു. നിങ്ങൾ പരിവർത്തനം ചെയ്യുമ്പോൾ DevTools-ൽ നെറ്റ്‌വർക്ക് ടാബ് തുറക്കുക - നിങ്ങളുടെ ഫയൽ കൊണ്ടുപോകുന്ന ഔട്ട്ബൗണ്ട് ട്രാഫിക്കൊന്നും നിങ്ങൾ കാണില്ല.

ഇത് ശരിക്കും സൗജന്യമാണോ?

അതെ. സൈൻഅപ്പ് ഇല്ല, ക്വാട്ട ഇല്ല, അപ്‌ഗ്രേഡ് ടയർ ഇല്ല. പരിവർത്തനം നിങ്ങളുടെ മെഷീനിൽ പ്രവർത്തിക്കുന്നു, അതിനാൽ ഇത് ഹോസ്റ്റുചെയ്യുന്നതിന് ഞങ്ങൾക്ക് ഒന്നും ചെലവാകില്ല.