محوّل متخصص · يعمل 100% في متصفحك

OCR لاستخراج نص من PDF

استخراج النص من PDF ممسوح ضوئيًا أو مبني على صور باستخدام OCR (Tesseract.js + pdf.js). يُعرض كل صفحة على canvas ثم يُطبَّق عليها OCR. يعمل مع المستندات التي لا يمكن تحديد نصها. يظهر تقدم الصفحات المتعددة أثناء التحويل.

بدون رفعبدون تسجيلبدون تتبعمجاني وغير محدود
أسقط ملف PDF هنا
أو انقر لاختيار ملف

طريقة الاستخدام

  1. أسقط ملف PDF هنا.
  2. اختر لغة المستند من القائمة المنسدلة.
  3. يحمّل Tesseract.js بيانات اللغة (~10 ميجابايت لكل لغة، تُخزَّن مؤقتًا بعد الاستخدام الأول).
  4. يعمل OCR محليًا ويُعرض ناتج TXT للتنزيل.

الأسئلة الشائعة

ما مدى دقة OCR؟

Tesseract هو أحد أفضل محركات OCR مفتوحة المصدر. للنصوص الحديثة النظيفة تتراوح الدقة عادةً بين 95-99%. الكتابة اليدوية والمسوحات منخفضة التباين أو الخطوط غير المعتادة قد تُقلّل الدقة بشكل ملحوظ.

لماذا يستغرق التحويل الأول وقتًا؟

يُنزَّل في أول تشغيل ~10-15 ميجابايت من بيانات اللغة. بعدها تُخزَّن مؤقتًا لبقية الجلسة.

هل يُرفع مستندي أو صورتي إلى خادم؟

لا. يعمل التحويل كلياً في متصفحك باستخدام WebAssembly وواجهات برمجة الويب. افتح علامة Network في DevTools أثناء التحويل — لن ترى أي حركة بيانات صادرة تحمل ملفك.

هل هذا مجاني فعلاً؟

نعم. بدون تسجيل، بدون حصة، بدون طبقة مدفوعة. التحويل يعمل على جهازك فلا يُكلّفنا شيئاً لاستضافته.