ವಿಶೇಷ ಪರಿವರ್ತಕ · ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ 100% ರನ್ ಆಗುತ್ತದೆ

PDF ನಿಂದ TXT OCR

OCR (Tesseract.js + pdf.js) ಬಳಸಿಕೊಂಡು ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಅಥವಾ ಇಮೇಜ್ ಆಧಾರಿತ PDF ನಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಿರಿ. ಪ್ರತಿ ಪುಟವನ್ನು ಕ್ಯಾನ್ವಾಸ್‌ಗೆ ಸಲ್ಲಿಸಲಾಗುತ್ತದೆ ಮತ್ತು OCR'd. ಪಠ್ಯವನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗದ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳಿಗಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಪರಿವರ್ತನೆ ರನ್ ಆಗುತ್ತಿದ್ದಂತೆ ಬಹು-ಪುಟದ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲಾಗುತ್ತದೆ.

ಯಾವುದೇ ಅಪ್‌ಲೋಡ್ ಇಲ್ಲಯಾವುದೇ ಸೈನ್ ಅಪ್ ಇಲ್ಲಟ್ರ್ಯಾಕಿಂಗ್ ಇಲ್ಲಉಚಿತ, ಅನಿಯಮಿತ
ನಿಮ್ಮ PDF ಫೈಲ್ ಅನ್ನು ಇಲ್ಲಿ ಬಿಡಿ
ಅಥವಾ ಫೈಲ್ ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಕ್ಲಿಕ್ ಮಾಡಿ

ಹೇಗೆ ಬಳಸುವುದು

  1. ನಿಮ್ಮ PDF ಫೈಲ್ ಅನ್ನು ಬಿಡಿ.
  2. ಡ್ರಾಪ್‌ಡೌನ್‌ನಿಂದ ಡಾಕ್ಯುಮೆಂಟ್‌ನ ಭಾಷೆಯನ್ನು ಆರಿಸಿ.
  3. Tesseract.js ಭಾಷೆಯ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡುತ್ತದೆ (ಪ್ರತಿ ಭಾಷೆಗೆ ~10 MB, ಮೊದಲ ಬಳಕೆಯ ನಂತರ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ).
  4. OCR ಸ್ಥಳೀಯವಾಗಿ ಚಲಿಸುತ್ತದೆ ಮತ್ತು TXT ಔಟ್‌ಪುಟ್ ಅನ್ನು ಡೌನ್‌ಲೋಡ್‌ಗಾಗಿ ನೀಡಲಾಗುತ್ತದೆ.

FAQ

OCR ಎಷ್ಟು ನಿಖರವಾಗಿದೆ?

ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅತ್ಯುತ್ತಮ ತೆರೆದ ಮೂಲ OCR ಎಂಜಿನ್‌ಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ. ಶುದ್ಧ, ಆಧುನಿಕ ಪಠ್ಯಕ್ಕಾಗಿ ಇದು ಸಾಮಾನ್ಯವಾಗಿ 95-99% ನಿಖರವಾಗಿದೆ. ಕೈಬರಹ, ಕಡಿಮೆ-ಕಾಂಟ್ರಾಸ್ಟ್ ಸ್ಕ್ಯಾನ್‌ಗಳು ಅಥವಾ ಅಸಾಮಾನ್ಯ ಫಾಂಟ್‌ಗಳು ನಿಖರತೆಯನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಕುಸಿಯಬಹುದು.

ಮೊದಲ ಪರಿವರ್ತನೆ ಏಕೆ ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ?

ಮೊದಲ ರನ್ ಡೌನ್‌ಲೋಡ್‌ಗಳು ~10-15 MB ಭಾಷಾ ಡೇಟಾ. ಅದರ ನಂತರ ಅದನ್ನು ನಿಮ್ಮ ಉಳಿದ ಅವಧಿಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ.

ನನ್ನ ಡಾಕ್ಯುಮೆಂಟ್ ಅಥವಾ ಇಮೇಜ್ ಸರ್ವರ್‌ಗೆ ಅಪ್‌ಲೋಡ್ ಆಗುತ್ತದೆಯೇ?

ಸಂಖ್ಯೆ. ಪರಿವರ್ತನೆಯು WebAssembly ಮತ್ತು Web API ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಿಮ್ಮ ಬ್ರೌಸರ್‌ನಲ್ಲಿ ಸಂಪೂರ್ಣವಾಗಿ ರನ್ ಆಗುತ್ತದೆ. ನೀವು ಪರಿವರ್ತಿಸುವಾಗ DevTools ನಲ್ಲಿ ನೆಟ್‌ವರ್ಕ್ ಟ್ಯಾಬ್ ತೆರೆಯಿರಿ - ನಿಮ್ಮ ಫೈಲ್ ಅನ್ನು ಹೊರಹೋಗುವ ಯಾವುದೇ ಟ್ರಾಫಿಕ್ ಅನ್ನು ನೀವು ನೋಡುವುದಿಲ್ಲ.

ಇದು ನಿಜವಾಗಿಯೂ ಉಚಿತವೇ?

ಹೌದು. ಯಾವುದೇ ಸೈನ್‌ಅಪ್ ಇಲ್ಲ, ಕೋಟಾ ಇಲ್ಲ, ಅಪ್‌ಗ್ರೇಡ್ ಶ್ರೇಣಿ ಇಲ್ಲ. ಪರಿವರ್ತನೆಯು ನಿಮ್ಮ ಯಂತ್ರದಲ್ಲಿ ಚಲಿಸುತ್ತದೆ, ಆದ್ದರಿಂದ ಹೋಸ್ಟ್ ಮಾಡಲು ನಮಗೆ ಏನೂ ವೆಚ್ಚವಾಗುವುದಿಲ್ಲ.