محول متخصص · يعمل بنسبة 100% في متصفحك
PDF إلى TXT OCR
قم باستخراج النص من ملف PDF ممسوح ضوئيًا أو مستند إلى صورة باستخدام OCR (Tesseract.js + pdf.js). يتم تقديم كل صفحة إلى لوحة قماشية ويتم التعرف الضوئي على الحروف عليها. يعمل مع المستندات التي لا يمكن تحديد النص فيها. يتم عرض التقدم متعدد الصفحات أثناء تشغيل التحويل.
كيفية الاستخدام
- قم بإسقاط ملف PDF الخاص بك.
- اختر لغة المستند من القائمة المنسدلة.
- يقوم Tesseract.js بتحميل بيانات اللغة (حوالي 10 ميجابايت لكل لغة، ويتم تخزينها مؤقتًا بعد الاستخدام الأول).
- يتم تشغيل OCR محليًا ويتم عرض مخرجات TXT للتنزيل.
الأسئلة الشائعة
ما مدى دقة التعرف الضوئي على الحروف؟
يعد Tesseract أحد أفضل محركات التعرف الضوئي على الحروف مفتوحة المصدر. للحصول على نص نظيف وحديث، تبلغ دقة النص عادةً 95-99%. يمكن أن تؤدي الكتابة اليدوية أو عمليات المسح منخفضة التباين أو الخطوط غير المعتادة إلى انخفاض الدقة بشكل كبير.
لماذا يستغرق التحويل الأول بعض الوقت؟
يتم تنزيل حوالي 10-15 ميجابايت من بيانات اللغة في المرة الأولى. بعد ذلك يتم تخزينه مؤقتًا لبقية الجلسة.
هل يتم تحميل المستند أو الصورة الخاصة بي إلى الخادم؟
لا. يتم تشغيل التحويل بالكامل في متصفحك باستخدام WebAssembly وWeb APIs. افتح علامة التبويب "الشبكة" في DevTools أثناء التحويل - لن ترى أي حركة مرور صادرة تحمل ملفك.
هل هذا مجاني حقًا؟
نعم. لا يوجد اشتراك، ولا حصة، ولا طبقة ترقية. يتم تشغيل التحويل على جهازك، لذا لا تكلفنا استضافته شيئًا.