ממיר מיוחד · פועל 100% בדפדפן שלך
PDF ל-TXT OCR
חלץ טקסט מקובץ PDF סרוק או מבוסס תמונה באמצעות OCR (Tesseract.js + pdf.js). כל עמוד מעובד לקנבס ומבצע OCR. עובד עבור מסמכים שבהם הטקסט אינו ניתן לבחירה. התקדמות מרובה עמודים מוצגת כאשר ההמרה פועלת.
כיצד להשתמש
- שחרר את קובץ ה-PDF שלך.
- בחר את שפת המסמך מהתפריט הנפתח.
- Tesseract.js טוען את נתוני השפה (~10 MB לשפה, מאוחסן במטמון לאחר השימוש הראשון).
- OCR פועל באופן מקומי ופלט TXT מוצע להורדה.
שאלות נפוצות
כמה מדויק ה-OCR?
Tesseract הוא אחד ממנועי ה-OCR הטובים ביותר בקוד פתוח. עבור טקסט נקי ומודרני, זה בדרך כלל מדויק ב-95-99%. כתב יד, סריקות עם ניגודיות נמוכה או גופנים יוצאי דופן עלולים להוריד את הדיוק באופן משמעותי.
מדוע ההמרה הראשונה נמשכת זמן מה?
הריצה הראשונה מורידה ~10-15 MB של נתוני שפה. לאחר מכן הוא נשמר במטמון לשארית הפגישה שלך.
האם המסמך או התמונה שלי מעלים לשרת?
לא. ההמרה פועלת כולה בדפדפן שלך באמצעות WebAssembly ו-Web APIs. פתח את הכרטיסייה רשת ב-DevTools בזמן שאתה ממיר - לא תראה תעבורה יוצאת הנושאת את הקובץ שלך.
האם זה באמת בחינם?
כן. ללא הרשמה, ללא מכסה, ללא שכבת שדרוג. ההמרה פועלת על המחשב שלך, כך שלא עולה לנו כלום לארח.