ממיר מיוחד · פועל 100% בדפדפן שלך

PDF ל-TXT OCR

חלץ טקסט מקובץ PDF סרוק או מבוסס תמונה באמצעות OCR (Tesseract.js + pdf.js). כל עמוד מעובד לקנבס ומבצע OCR. עובד עבור מסמכים שבהם הטקסט אינו ניתן לבחירה. התקדמות מרובה עמודים מוצגת כאשר ההמרה פועלת.

אין העלאהאין הרשמהאין מעקבחינם, ללא הגבלה
שחרר את קובץ ה-PDF שלך כאן
או לחץ כדי לבחור קובץ

כיצד להשתמש

  1. שחרר את קובץ ה-PDF שלך.
  2. בחר את שפת המסמך מהתפריט הנפתח.
  3. Tesseract.js טוען את נתוני השפה (~10 MB לשפה, מאוחסן במטמון לאחר השימוש הראשון).
  4. OCR פועל באופן מקומי ופלט TXT מוצע להורדה.

שאלות נפוצות

כמה מדויק ה-OCR?

Tesseract הוא אחד ממנועי ה-OCR הטובים ביותר בקוד פתוח. עבור טקסט נקי ומודרני, זה בדרך כלל מדויק ב-95-99%. כתב יד, סריקות עם ניגודיות נמוכה או גופנים יוצאי דופן עלולים להוריד את הדיוק באופן משמעותי.

מדוע ההמרה הראשונה נמשכת זמן מה?

הריצה הראשונה מורידה ~10-15 MB של נתוני שפה. לאחר מכן הוא נשמר במטמון לשארית הפגישה שלך.

האם המסמך או התמונה שלי מעלים לשרת?

לא. ההמרה פועלת כולה בדפדפן שלך באמצעות WebAssembly ו-Web APIs. פתח את הכרטיסייה רשת ב-DevTools בזמן שאתה ממיר - לא תראה תעבורה יוצאת הנושאת את הקובץ שלך.

האם זה באמת בחינם?

כן. ללא הרשמה, ללא מכסה, ללא שכבת שדרוג. ההמרה פועלת על המחשב שלך, כך שלא עולה לנו כלום לארח.