Εξειδικευμένος μετατροπέας · εκτελείται 100% στο πρόγραμμα περιήγησής σας

PDF σε TXT OCR

Εξαγωγή κειμένου από σαρωμένο ή βασισμένο σε εικόνα PDF χρησιμοποιώντας OCR (Tesseract.js + pdf.js). Κάθε σελίδα αποδίδεται σε καμβά και OCR'd. Λειτουργεί για έγγραφα όπου το κείμενο δεν είναι επιλέξιμο. Η πρόοδος πολλών σελίδων εμφανίζεται καθώς εκτελείται η μετατροπή.

Χωρίς μεταφόρτωσηΧωρίς εγγραφήΧωρίς παρακολούθησηΔωρεάν, απεριόριστο
Αποθέστε το αρχείο PDF σας εδώ
ή κάντε κλικ για να επιλέξετε ένα αρχείο

Τρόπος χρήσης

  1. Αποθέστε το αρχείο PDF σας.
  2. Επιλέξτε τη γλώσσα του εγγράφου από το αναπτυσσόμενο μενού.
  3. Το Tesseract.js φορτώνει τα δεδομένα γλώσσας (~10 MB ανά γλώσσα, αποθηκευμένα στην κρυφή μνήμη μετά την πρώτη χρήση). Το
  4. OCR εκτελείται τοπικά και η έξοδος TXT προσφέρεται για λήψη.

Συχνές ερωτήσεις

Πόσο ακριβές είναι το OCR;

Το Tesseract είναι ένας από τους καλύτερους κινητήρες OCR ανοιχτού κώδικα. Για καθαρό, μοντέρνο κείμενο είναι συνήθως 95-99% ακριβές. Το χειρόγραφο, οι σαρώσεις χαμηλής αντίθεσης ή οι ασυνήθιστες γραμματοσειρές μπορούν να μειώσουν σημαντικά την ακρίβεια.

Γιατί η πρώτη μετατροπή διαρκεί λίγο;

Η πρώτη εκτέλεση κατεβάζει ~10-15 MB δεδομένων γλώσσας. Μετά από αυτό, αποθηκεύεται προσωρινά για το υπόλοιπο της συνεδρίας σας.

Αποστέλλεται το έγγραφο ή η εικόνα μου σε διακομιστή;

Όχι. Η μετατροπή εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας χρησιμοποιώντας WebAssembly και Web API. Ανοίξτε την καρτέλα Δίκτυο στο DevTools ενώ πραγματοποιείτε μετατροπή — δεν θα δείτε εξερχόμενη κίνηση που μεταφέρει το αρχείο σας.

Είναι πραγματικά δωρεάν;

Ναι. Χωρίς εγγραφή, χωρίς όριο, χωρίς επίπεδο αναβάθμισης. Η μετατροπή εκτελείται στον υπολογιστή σας, επομένως δεν μας κοστίζει τίποτα να φιλοξενήσουμε.