Εξειδικευμένος μετατροπέας · εκτελείται 100% στο πρόγραμμα περιήγησής σας

PDF σε PDF με δυνατότητα αναζήτησης OCR

Προσθέστε ένα αόρατο επίπεδο κειμένου OCR σε ένα σαρωμένο PDF, ώστε να γίνεται αναζήτηση + ευρετηρίαση, ενώ διατηρούνται οι αρχικές εικόνες της σελίδας. Κάθε σελίδα αποδίδεται, OCR'd και ξαναχτίζεται με το κείμενο που τοποθετείται πάνω από την εικόνα στις σωστές συντεταγμένες. Η έξοδος είναι ένα τυπικό PDF που ανοίγει σε οποιοδήποτε πρόγραμμα ανάγνωσης. Το

Χωρίς μεταφόρτωσηΧωρίς εγγραφήΧωρίς παρακολούθησηΔωρεάν, απεριόριστο
Αποθέστε το αρχείο PDF σας εδώ
ή κάντε κλικ για να επιλέξετε ένα αρχείο

Τρόπος χρήσης

  1. Αποθέστε το αρχείο PDF σας.
  2. Επιλέξτε τη γλώσσα του εγγράφου από το αναπτυσσόμενο μενού.
  3. Το Tesseract.js φορτώνει τα δεδομένα γλώσσας (~10 MB ανά γλώσσα, αποθηκευμένα στην κρυφή μνήμη μετά την πρώτη χρήση). Το
  4. OCR εκτελείται τοπικά και η έξοδος PDF με δυνατότητα αναζήτησης προσφέρεται για λήψη.

Συχνές ερωτήσεις

Πόσο ακριβές είναι το OCR;

Το Tesseract είναι ένας από τους καλύτερους κινητήρες OCR ανοιχτού κώδικα. Για καθαρό, μοντέρνο κείμενο είναι συνήθως 95-99% ακριβές. Το χειρόγραφο, οι σαρώσεις χαμηλής αντίθεσης ή οι ασυνήθιστες γραμματοσειρές μπορούν να μειώσουν σημαντικά την ακρίβεια.

Γιατί η πρώτη μετατροπή διαρκεί λίγο;

Η πρώτη εκτέλεση κατεβάζει ~10-15 MB δεδομένων γλώσσας. Μετά από αυτό, αποθηκεύεται προσωρινά για το υπόλοιπο της συνεδρίας σας.

Αποστέλλεται το έγγραφο ή η εικόνα μου σε διακομιστή;

Όχι. Η μετατροπή εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας χρησιμοποιώντας WebAssembly και Web API. Ανοίξτε την καρτέλα Δίκτυο στο DevTools ενώ πραγματοποιείτε μετατροπή — δεν θα δείτε εξερχόμενη κίνηση που μεταφέρει το αρχείο σας.

Είναι πραγματικά δωρεάν;

Ναι. Χωρίς εγγραφή, χωρίς όριο, χωρίς επίπεδο αναβάθμισης. Η μετατροπή εκτελείται στον υπολογιστή σας, επομένως δεν μας κοστίζει τίποτα να φιλοξενήσουμε.