محول متخصص · يعمل بنسبة 100% في متصفحك
PDF إلى PDF قابل للبحث في التعرف الضوئي على الحروف
أضف طبقة نص OCR غير مرئية إلى ملف PDF ممسوح ضوئيًا بحيث يصبح قابلاً للبحث + قابلاً للفهرسة مع الاحتفاظ بصور الصفحة الأصلية. يتم عرض كل صفحة، وتمييزها ضوئيًا، وإعادة بنائها مع وضع النص فوق الصورة بالإحداثيات الصحيحة. الإخراج هو ملف PDF قياسي يتم فتحه في أي قارئ.
كيفية الاستخدام
- قم بإسقاط ملف PDF الخاص بك.
- اختر لغة المستند من القائمة المنسدلة.
- يقوم Tesseract.js بتحميل بيانات اللغة (حوالي 10 ميجابايت لكل لغة، ويتم تخزينها مؤقتًا بعد الاستخدام الأول).
- يتم تشغيل تقنية التعرف الضوئي على الحروف (OCR) محليًا ويتم تقديم مخرجات PDF القابلة للبحث للتنزيل.
الأسئلة الشائعة
ما مدى دقة التعرف الضوئي على الحروف؟
يعد Tesseract أحد أفضل محركات التعرف الضوئي على الحروف مفتوحة المصدر. للحصول على نص نظيف وحديث، تبلغ دقة النص عادةً 95-99%. يمكن أن تؤدي الكتابة اليدوية أو عمليات المسح منخفضة التباين أو الخطوط غير المعتادة إلى انخفاض الدقة بشكل كبير.
لماذا يستغرق التحويل الأول بعض الوقت؟
يتم تنزيل حوالي 10-15 ميجابايت من بيانات اللغة في المرة الأولى. بعد ذلك يتم تخزينه مؤقتًا لبقية الجلسة.
هل يتم تحميل المستند أو الصورة الخاصة بي إلى الخادم؟
لا. يتم تشغيل التحويل بالكامل في متصفحك باستخدام WebAssembly وWeb APIs. افتح علامة التبويب "الشبكة" في DevTools أثناء التحويل - لن ترى أي حركة مرور صادرة تحمل ملفك.
هل هذا مجاني حقًا؟
نعم. لا يوجد اشتراك، ولا حصة، ولا طبقة ترقية. يتم تشغيل التحويل على جهازك، لذا لا تكلفنا استضافته شيئًا.