Convertisseur spécialisé · fonctionne 100% dans votre navigateur

OCR PDF vers TXT

Extrayez du texte d'un PDF scanné ou basé sur des images via OCR (Tesseract.js + pdf.js). Chaque page est rendue sur un canvas et soumise à l'OCR. Fonctionne pour les documents dont le texte n'est pas sélectionnable. La progression multi-pages est affichée pendant la conversion.

Sans envoiSans inscriptionSans traçageGratuit, illimité
Déposez votre fichier PDF ici
ou cliquez pour choisir un fichier

Comment utiliser

  1. Déposez votre fichier PDF.
  2. Choisissez la langue du document dans le menu déroulant.
  3. Tesseract.js charge les données linguistiques (~10 Mo par langue, mises en cache après le premier usage).
  4. L'OCR s'exécute localement et la sortie TXT est proposée au téléchargement.

FAQ

Quelle est la précision de l'OCR ?

Tesseract est l'un des meilleurs moteurs OCR open source. Pour un texte clair et moderne, la précision est typiquement de 95 à 99 %. L'écriture manuscrite, les scans à faible contraste ou les polices inhabituelles peuvent réduire significativement la précision.

Pourquoi la première conversion prend-elle du temps ?

Le premier lancement télécharge ~10 à 15 Mo de données linguistiques. Ensuite, elles sont mises en cache pour le reste de votre session.

Mon document ou image est-il envoyé vers un serveur ?

Non. La conversion s'effectue entièrement dans votre navigateur via WebAssembly et les API Web. Ouvrez l'onglet Réseau dans DevTools pendant la conversion — vous ne verrez aucun trafic sortant transportant votre fichier.

Est-ce vraiment gratuit ?

Oui. Sans inscription, sans quota, sans offre payante. La conversion s'exécute sur votre machine, donc elle ne nous coûte rien à héberger.