Εξειδικευμένος μετατροπέας · εκτελείται 100% στο πρόγραμμα περιήγησής σας
PDF σε TXT OCR
Εξαγωγή κειμένου από σαρωμένο ή βασισμένο σε εικόνα PDF χρησιμοποιώντας OCR (Tesseract.js + pdf.js). Κάθε σελίδα αποδίδεται σε καμβά και OCR'd. Λειτουργεί για έγγραφα όπου το κείμενο δεν είναι επιλέξιμο. Η πρόοδος πολλών σελίδων εμφανίζεται καθώς εκτελείται η μετατροπή.
Τρόπος χρήσης
- Αποθέστε το αρχείο PDF σας.
- Επιλέξτε τη γλώσσα του εγγράφου από το αναπτυσσόμενο μενού.
- Το Tesseract.js φορτώνει τα δεδομένα γλώσσας (~10 MB ανά γλώσσα, αποθηκευμένα στην κρυφή μνήμη μετά την πρώτη χρήση). Το
- OCR εκτελείται τοπικά και η έξοδος TXT προσφέρεται για λήψη.
Συχνές ερωτήσεις
Πόσο ακριβές είναι το OCR;
Το Tesseract είναι ένας από τους καλύτερους κινητήρες OCR ανοιχτού κώδικα. Για καθαρό, μοντέρνο κείμενο είναι συνήθως 95-99% ακριβές. Το χειρόγραφο, οι σαρώσεις χαμηλής αντίθεσης ή οι ασυνήθιστες γραμματοσειρές μπορούν να μειώσουν σημαντικά την ακρίβεια.
Γιατί η πρώτη μετατροπή διαρκεί λίγο;
Η πρώτη εκτέλεση κατεβάζει ~10-15 MB δεδομένων γλώσσας. Μετά από αυτό, αποθηκεύεται προσωρινά για το υπόλοιπο της συνεδρίας σας.
Αποστέλλεται το έγγραφο ή η εικόνα μου σε διακομιστή;
Όχι. Η μετατροπή εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας χρησιμοποιώντας WebAssembly και Web API. Ανοίξτε την καρτέλα Δίκτυο στο DevTools ενώ πραγματοποιείτε μετατροπή — δεν θα δείτε εξερχόμενη κίνηση που μεταφέρει το αρχείο σας.
Είναι πραγματικά δωρεάν;
Ναι. Χωρίς εγγραφή, χωρίς όριο, χωρίς επίπεδο αναβάθμισης. Η μετατροπή εκτελείται στον υπολογιστή σας, επομένως δεν μας κοστίζει τίποτα να φιλοξενήσουμε.