ਵਿਸ਼ੇਸ਼ ਕਨਵਰਟਰ · ਤੁਹਾਡੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ 100% ਚੱਲਦਾ ਹੈ
TXT OCR ਲਈ ਚਿੱਤਰ
Tesseract.js ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਇੱਕ ਚਿੱਤਰ (ਸਕ੍ਰੀਨਸ਼ਾਟ, ਸਕੈਨ, ਫੋਟੋ) ਤੋਂ ਟੈਕਸਟ ਐਕਸਟਰੈਕਟ ਕਰੋ — WebAssembly ਵਿੱਚ ਕੰਪਾਇਲ ਕੀਤਾ ਗਿਆ ਓਪਨ-ਸਰੋਤ OCR ਇੰਜਣ। 14 ਆਮ ਭਾਸ਼ਾਵਾਂ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ। ਸਾਰੀ OCR ਪਾਈਪਲਾਈਨ ਤੁਹਾਡੇ ਬਰਾਊਜ਼ਰ ਵਿੱਚ ਚੱਲਦੀ ਹੈ; ਚਿੱਤਰ ਕਦੇ ਅੱਪਲੋਡ ਨਹੀਂ ਹੁੰਦਾ।
ਕਿਵੇਂ ਵਰਤਣਾ ਹੈ
- ਆਪਣੀ ਚਿੱਤਰ ਫਾਈਲ ਨੂੰ ਸੁੱਟੋ।
- ਡਰਾਪਡਾਊਨ ਤੋਂ ਦਸਤਾਵੇਜ਼ ਦੀ ਭਾਸ਼ਾ ਚੁਣੋ।
- Tesseract.js ਭਾਸ਼ਾ ਡੇਟਾ ਲੋਡ ਕਰਦਾ ਹੈ (~10 MB ਪ੍ਰਤੀ ਭਾਸ਼ਾ, ਪਹਿਲੀ ਵਰਤੋਂ ਤੋਂ ਬਾਅਦ ਕੈਸ਼ ਕੀਤਾ ਗਿਆ)।
- OCR ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਚੱਲਦਾ ਹੈ ਅਤੇ TXT ਆਉਟਪੁੱਟ ਨੂੰ ਡਾਊਨਲੋਡ ਕਰਨ ਲਈ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ
OCR ਕਿੰਨਾ ਸਹੀ ਹੈ?
Tesseract ਸਭ ਤੋਂ ਵਧੀਆ ਓਪਨ ਸੋਰਸ OCR ਇੰਜਣਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਸਾਫ਼, ਆਧੁਨਿਕ ਟੈਕਸਟ ਲਈ ਇਹ ਆਮ ਤੌਰ 'ਤੇ 95-99% ਸਹੀ ਹੁੰਦਾ ਹੈ। ਹੈਂਡਰਾਈਟਿੰਗ, ਘੱਟ-ਕੰਟਰਾਸਟ ਸਕੈਨ, ਜਾਂ ਅਸਧਾਰਨ ਫੌਂਟ ਸਟੀਕਤਾ ਨੂੰ ਮਹੱਤਵਪੂਰਣ ਰੂਪ ਵਿੱਚ ਘਟਾ ਸਕਦੇ ਹਨ।
ਪਹਿਲੇ ਪਰਿਵਰਤਨ ਵਿੱਚ ਕੁਝ ਸਮਾਂ ਕਿਉਂ ਲੱਗਦਾ ਹੈ?
ਪਹਿਲੀ ਵਾਰ ~ 10-15 MB ਭਾਸ਼ਾ ਡੇਟਾ ਡਾਊਨਲੋਡ ਕਰਦਾ ਹੈ। ਉਸ ਤੋਂ ਬਾਅਦ ਇਹ ਤੁਹਾਡੇ ਬਾਕੀ ਸੈਸ਼ਨ ਲਈ ਕੈਸ਼ ਹੋ ਜਾਂਦਾ ਹੈ।
ਕੀ ਮੇਰਾ ਦਸਤਾਵੇਜ਼ ਜਾਂ ਚਿੱਤਰ ਸਰਵਰ 'ਤੇ ਅੱਪਲੋਡ ਹੁੰਦਾ ਹੈ?
ਨਹੀਂ। ਪਰਿਵਰਤਨ ਪੂਰੀ ਤਰ੍ਹਾਂ ਤੁਹਾਡੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ WebAssembly ਅਤੇ Web APIs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਚੱਲਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਕਨਵਰਟ ਕਰਦੇ ਹੋ ਤਾਂ DevTools ਵਿੱਚ ਨੈੱਟਵਰਕ ਟੈਬ ਖੋਲ੍ਹੋ — ਤੁਹਾਨੂੰ ਤੁਹਾਡੀ ਫ਼ਾਈਲ ਨੂੰ ਲਿਜਾਣ ਵਾਲਾ ਕੋਈ ਆਊਟਬਾਊਂਡ ਟਰੈਫ਼ਿਕ ਨਹੀਂ ਦਿਸੇਗਾ।
ਕੀ ਇਹ ਸੱਚਮੁੱਚ ਮੁਫ਼ਤ ਹੈ?
ਹਾਂ। ਕੋਈ ਸਾਈਨਅਪ ਨਹੀਂ, ਕੋਈ ਕੋਟਾ ਨਹੀਂ, ਕੋਈ ਅਪਗ੍ਰੇਡ ਟੀਅਰ ਨਹੀਂ। ਪਰਿਵਰਤਨ ਤੁਹਾਡੀ ਮਸ਼ੀਨ 'ਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਇਸਦੀ ਮੇਜ਼ਬਾਨੀ ਕਰਨ ਲਈ ਸਾਨੂੰ ਕੋਈ ਖਰਚਾ ਨਹੀਂ ਆਉਂਦਾ।