ವಿಶೇಷ ಪರಿವರ್ತಕ · ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ 100% ರನ್ ಆಗುತ್ತದೆ
PDF ನಿಂದ TXT OCR
OCR (Tesseract.js + pdf.js) ಬಳಸಿಕೊಂಡು ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಅಥವಾ ಇಮೇಜ್ ಆಧಾರಿತ PDF ನಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಿರಿ. ಪ್ರತಿ ಪುಟವನ್ನು ಕ್ಯಾನ್ವಾಸ್ಗೆ ಸಲ್ಲಿಸಲಾಗುತ್ತದೆ ಮತ್ತು OCR'd. ಪಠ್ಯವನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗದ ಡಾಕ್ಯುಮೆಂಟ್ಗಳಿಗಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಪರಿವರ್ತನೆ ರನ್ ಆಗುತ್ತಿದ್ದಂತೆ ಬಹು-ಪುಟದ ಪ್ರಗತಿಯನ್ನು ತೋರಿಸಲಾಗುತ್ತದೆ.
ಹೇಗೆ ಬಳಸುವುದು
- ನಿಮ್ಮ PDF ಫೈಲ್ ಅನ್ನು ಬಿಡಿ.
- ಡ್ರಾಪ್ಡೌನ್ನಿಂದ ಡಾಕ್ಯುಮೆಂಟ್ನ ಭಾಷೆಯನ್ನು ಆರಿಸಿ.
- Tesseract.js ಭಾಷೆಯ ಡೇಟಾವನ್ನು ಲೋಡ್ ಮಾಡುತ್ತದೆ (ಪ್ರತಿ ಭಾಷೆಗೆ ~10 MB, ಮೊದಲ ಬಳಕೆಯ ನಂತರ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ).
- OCR ಸ್ಥಳೀಯವಾಗಿ ಚಲಿಸುತ್ತದೆ ಮತ್ತು TXT ಔಟ್ಪುಟ್ ಅನ್ನು ಡೌನ್ಲೋಡ್ಗಾಗಿ ನೀಡಲಾಗುತ್ತದೆ.
FAQ
OCR ಎಷ್ಟು ನಿಖರವಾಗಿದೆ?
ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅತ್ಯುತ್ತಮ ತೆರೆದ ಮೂಲ OCR ಎಂಜಿನ್ಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ. ಶುದ್ಧ, ಆಧುನಿಕ ಪಠ್ಯಕ್ಕಾಗಿ ಇದು ಸಾಮಾನ್ಯವಾಗಿ 95-99% ನಿಖರವಾಗಿದೆ. ಕೈಬರಹ, ಕಡಿಮೆ-ಕಾಂಟ್ರಾಸ್ಟ್ ಸ್ಕ್ಯಾನ್ಗಳು ಅಥವಾ ಅಸಾಮಾನ್ಯ ಫಾಂಟ್ಗಳು ನಿಖರತೆಯನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಕುಸಿಯಬಹುದು.
ಮೊದಲ ಪರಿವರ್ತನೆ ಏಕೆ ಸ್ವಲ್ಪ ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ?
ಮೊದಲ ರನ್ ಡೌನ್ಲೋಡ್ಗಳು ~10-15 MB ಭಾಷಾ ಡೇಟಾ. ಅದರ ನಂತರ ಅದನ್ನು ನಿಮ್ಮ ಉಳಿದ ಅವಧಿಗೆ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ.
ನನ್ನ ಡಾಕ್ಯುಮೆಂಟ್ ಅಥವಾ ಇಮೇಜ್ ಸರ್ವರ್ಗೆ ಅಪ್ಲೋಡ್ ಆಗುತ್ತದೆಯೇ?
ಸಂಖ್ಯೆ. ಪರಿವರ್ತನೆಯು WebAssembly ಮತ್ತು Web API ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಿಮ್ಮ ಬ್ರೌಸರ್ನಲ್ಲಿ ಸಂಪೂರ್ಣವಾಗಿ ರನ್ ಆಗುತ್ತದೆ. ನೀವು ಪರಿವರ್ತಿಸುವಾಗ DevTools ನಲ್ಲಿ ನೆಟ್ವರ್ಕ್ ಟ್ಯಾಬ್ ತೆರೆಯಿರಿ - ನಿಮ್ಮ ಫೈಲ್ ಅನ್ನು ಹೊರಹೋಗುವ ಯಾವುದೇ ಟ್ರಾಫಿಕ್ ಅನ್ನು ನೀವು ನೋಡುವುದಿಲ್ಲ.
ಇದು ನಿಜವಾಗಿಯೂ ಉಚಿತವೇ?
ಹೌದು. ಯಾವುದೇ ಸೈನ್ಅಪ್ ಇಲ್ಲ, ಕೋಟಾ ಇಲ್ಲ, ಅಪ್ಗ್ರೇಡ್ ಶ್ರೇಣಿ ಇಲ್ಲ. ಪರಿವರ್ತನೆಯು ನಿಮ್ಮ ಯಂತ್ರದಲ್ಲಿ ಚಲಿಸುತ್ತದೆ, ಆದ್ದರಿಂದ ಹೋಸ್ಟ್ ಮಾಡಲು ನಮಗೆ ಏನೂ ವೆಚ್ಚವಾಗುವುದಿಲ್ಲ.