ਵਿਸ਼ੇਸ਼ ਕਨਵਰਟਰ · ਤੁਹਾਡੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ 100% ਚੱਲਦਾ ਹੈ

PDF ਤੋਂ TXT OCR

OCR (Tesseract.js + pdf.js) ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਇੱਕ ਸਕੈਨ ਜਾਂ ਚਿੱਤਰ-ਆਧਾਰਿਤ PDF ਤੋਂ ਟੈਕਸਟ ਐਕਸਟਰੈਕਟ ਕਰੋ। ਹਰੇਕ ਪੰਨੇ ਨੂੰ ਇੱਕ ਕੈਨਵਸ ਅਤੇ OCR'd ਵਿੱਚ ਰੈਂਡਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਉਹਨਾਂ ਦਸਤਾਵੇਜ਼ਾਂ ਲਈ ਕੰਮ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਟੈਕਸਟ ਚੋਣਯੋਗ ਨਹੀਂ ਹੈ। ਬਹੁ-ਪੰਨਿਆਂ ਦੀ ਪ੍ਰਗਤੀ ਨੂੰ ਪਰਿਵਰਤਨ ਦੇ ਚੱਲਣ ਦੇ ਰੂਪ ਵਿੱਚ ਦਿਖਾਇਆ ਗਿਆ ਹੈ।

ਕੋਈ ਅੱਪਲੋਡ ਨਹੀਂਕੋਈ ਸਾਈਨ ਅੱਪ ਨਹੀਂਕੋਈ ਟਰੈਕਿੰਗ ਨਹੀਂਮੁਫ਼ਤ, ਅਸੀਮਤ
ਆਪਣੀ PDF ਫਾਈਲ ਇੱਥੇ ਸੁੱਟੋ
ਜਾਂ ਫਾਈਲ ਚੁਣਨ ਲਈ ਕਲਿੱਕ ਕਰੋ

ਕਿਵੇਂ ਵਰਤਣਾ ਹੈ

  1. ਆਪਣੀ PDF ਫਾਈਲ ਛੱਡੋ।
  2. ਡਰਾਪਡਾਊਨ ਤੋਂ ਦਸਤਾਵੇਜ਼ ਦੀ ਭਾਸ਼ਾ ਚੁਣੋ।
  3. Tesseract.js ਭਾਸ਼ਾ ਡੇਟਾ ਲੋਡ ਕਰਦਾ ਹੈ (~10 MB ਪ੍ਰਤੀ ਭਾਸ਼ਾ, ਪਹਿਲੀ ਵਰਤੋਂ ਤੋਂ ਬਾਅਦ ਕੈਸ਼ ਕੀਤਾ ਗਿਆ)।
  4. OCR ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਚੱਲਦਾ ਹੈ ਅਤੇ TXT ਆਉਟਪੁੱਟ ਨੂੰ ਡਾਊਨਲੋਡ ਕਰਨ ਲਈ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

OCR ਕਿੰਨਾ ਸਹੀ ਹੈ?

Tesseract ਸਭ ਤੋਂ ਵਧੀਆ ਓਪਨ ਸੋਰਸ OCR ਇੰਜਣਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਸਾਫ਼, ਆਧੁਨਿਕ ਟੈਕਸਟ ਲਈ ਇਹ ਆਮ ਤੌਰ 'ਤੇ 95-99% ਸਹੀ ਹੁੰਦਾ ਹੈ। ਹੈਂਡਰਾਈਟਿੰਗ, ਘੱਟ-ਕੰਟਰਾਸਟ ਸਕੈਨ, ਜਾਂ ਅਸਧਾਰਨ ਫੌਂਟ ਸਟੀਕਤਾ ਨੂੰ ਮਹੱਤਵਪੂਰਣ ਰੂਪ ਵਿੱਚ ਘਟਾ ਸਕਦੇ ਹਨ।

ਪਹਿਲੇ ਪਰਿਵਰਤਨ ਵਿੱਚ ਕੁਝ ਸਮਾਂ ਕਿਉਂ ਲੱਗਦਾ ਹੈ?

ਪਹਿਲੀ ਵਾਰ ~ 10-15 MB ਭਾਸ਼ਾ ਡੇਟਾ ਡਾਊਨਲੋਡ ਕਰਦਾ ਹੈ। ਉਸ ਤੋਂ ਬਾਅਦ ਇਹ ਤੁਹਾਡੇ ਬਾਕੀ ਸੈਸ਼ਨ ਲਈ ਕੈਸ਼ ਹੋ ਜਾਂਦਾ ਹੈ।

ਕੀ ਮੇਰਾ ਦਸਤਾਵੇਜ਼ ਜਾਂ ਚਿੱਤਰ ਸਰਵਰ 'ਤੇ ਅੱਪਲੋਡ ਹੁੰਦਾ ਹੈ?

ਨਹੀਂ। ਪਰਿਵਰਤਨ ਪੂਰੀ ਤਰ੍ਹਾਂ ਤੁਹਾਡੇ ਬ੍ਰਾਊਜ਼ਰ ਵਿੱਚ WebAssembly ਅਤੇ Web APIs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਚੱਲਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਕਨਵਰਟ ਕਰਦੇ ਹੋ ਤਾਂ DevTools ਵਿੱਚ ਨੈੱਟਵਰਕ ਟੈਬ ਖੋਲ੍ਹੋ — ਤੁਹਾਨੂੰ ਤੁਹਾਡੀ ਫ਼ਾਈਲ ਨੂੰ ਲਿਜਾਣ ਵਾਲਾ ਕੋਈ ਆਊਟਬਾਊਂਡ ਟਰੈਫ਼ਿਕ ਨਹੀਂ ਦਿਸੇਗਾ।

ਕੀ ਇਹ ਸੱਚਮੁੱਚ ਮੁਫ਼ਤ ਹੈ?

ਹਾਂ। ਕੋਈ ਸਾਈਨਅਪ ਨਹੀਂ, ਕੋਈ ਕੋਟਾ ਨਹੀਂ, ਕੋਈ ਅਪਗ੍ਰੇਡ ਟੀਅਰ ਨਹੀਂ। ਪਰਿਵਰਤਨ ਤੁਹਾਡੀ ਮਸ਼ੀਨ 'ਤੇ ਚੱਲਦਾ ਹੈ, ਇਸ ਲਈ ਇਸਦੀ ਮੇਜ਼ਬਾਨੀ ਕਰਨ ਲਈ ਸਾਨੂੰ ਕੋਈ ਖਰਚਾ ਨਹੀਂ ਆਉਂਦਾ।