How accurate is the OCR?

Tesseract is one of the best open-source OCR engines. For clean, modern text it's typically 95-99% accurate. Handwriting, low-contrast scans, or unusual fonts can drop accuracy significantly.

Why does the first conversion take a while?

The first run downloads ~10-15 MB of language data. After that it's cached for the rest of your session.

Does my document or image upload to a server?

No. Conversion runs entirely in your browser using WebAssembly and Web APIs. Open the Network tab in DevTools while you convert — you'll see no outbound traffic carrying your file.

Yes. No signup, no quota, no upgrade tier. The conversion runs on your machine, so it costs us nothing to host.

محوّل متخصص · يعمل 100% في متصفحك

OCR لاستخراج نص من PDF

استخراج النص من PDF ممسوح ضوئيًا أو مبني على صور باستخدام OCR (Tesseract.js + pdf.js). يُعرض كل صفحة على canvas ثم يُطبَّق عليها OCR. يعمل مع المستندات التي لا يمكن تحديد نصها. يظهر تقدم الصفحات المتعددة أثناء التحويل.

بدون رفعبدون تسجيلبدون تتبعمجاني وغير محدود

أسقط ملف PDF هنا

أو انقر لاختيار ملف

اللغة

طريقة الاستخدام

أسقط ملف PDF هنا.
اختر لغة المستند من القائمة المنسدلة.
يحمّل Tesseract.js بيانات اللغة (~10 ميجابايت لكل لغة، تُخزَّن مؤقتًا بعد الاستخدام الأول).
يعمل OCR محليًا ويُعرض ناتج TXT للتنزيل.

الأسئلة الشائعة

ما مدى دقة OCR؟

Tesseract هو أحد أفضل محركات OCR مفتوحة المصدر. للنصوص الحديثة النظيفة تتراوح الدقة عادةً بين 95-99%. الكتابة اليدوية والمسوحات منخفضة التباين أو الخطوط غير المعتادة قد تُقلّل الدقة بشكل ملحوظ.

لماذا يستغرق التحويل الأول وقتًا؟

يُنزَّل في أول تشغيل ~10-15 ميجابايت من بيانات اللغة. بعدها تُخزَّن مؤقتًا لبقية الجلسة.

هل يُرفع مستندي أو صورتي إلى خادم؟

لا. يعمل التحويل كلياً في متصفحك باستخدام WebAssembly وواجهات برمجة الويب. افتح علامة Network في DevTools أثناء التحويل — لن ترى أي حركة بيانات صادرة تحمل ملفك.

هل هذا مجاني فعلاً؟

نعم. بدون تسجيل، بدون حصة، بدون طبقة مدفوعة. التحويل يعمل على جهازك فلا يُكلّفنا شيئاً لاستضافته.