ממיר מיוחד · פועל 100% בדפדפן שלך
PDF ל-PDF OCR הניתן לחיפוש
הוסף שכבת טקסט OCR בלתי נראית לקובץ PDF סרוק כך שיהיה ניתן לחיפוש + לאינדקס תוך שמירה על תמונות העמוד המקוריות. כל עמוד מעובד, מתבצע OCR ונבנה מחדש כשהטקסט מונח על התמונה בקואורדינטות הנכונות. פלט הוא PDF סטנדרטי שנפתח בכל קורא.
כיצד להשתמש
- שחרר את קובץ ה-PDF שלך.
- בחר את שפת המסמך מהתפריט הנפתח.
- Tesseract.js טוען את נתוני השפה (~10 MB לשפה, מאוחסן במטמון לאחר השימוש הראשון).
- OCR פועל באופן מקומי ופלט PDF הניתן לחיפוש מוצע להורדה.
שאלות נפוצות
כמה מדויק ה-OCR?
Tesseract הוא אחד ממנועי ה-OCR הטובים ביותר בקוד פתוח. עבור טקסט נקי ומודרני, זה בדרך כלל מדויק ב-95-99%. כתב יד, סריקות עם ניגודיות נמוכה או גופנים יוצאי דופן עלולים להוריד את הדיוק באופן משמעותי.
מדוע ההמרה הראשונה נמשכת זמן מה?
הריצה הראשונה מורידה ~10-15 MB של נתוני שפה. לאחר מכן הוא נשמר במטמון לשארית הפגישה שלך.
האם המסמך או התמונה שלי מעלים לשרת?
לא. ההמרה פועלת כולה בדפדפן שלך באמצעות WebAssembly ו-Web APIs. פתח את הכרטיסייה רשת ב-DevTools בזמן שאתה ממיר - לא תראה תעבורה יוצאת הנושאת את הקובץ שלך.
האם זה באמת בחינם?
כן. ללא הרשמה, ללא מכסה, ללא שכבת שדרוג. ההמרה פועלת על המחשב שלך, כך שלא עולה לנו כלום לארח.