Specialiseret konverter · kører 100% i din browser

PDF til TXT OCR

Uddrag tekst fra en scannet eller billedbaseret PDF ved hjælp af OCR (Tesseract.js + pdf.js). Hver side gengives til et lærred og OCR'd. Fungerer til dokumenter, hvor teksten ikke kan vælges. Fremskridt på flere sider vises, mens konverteringen kører.

Ingen uploadIngen tilmeldingIngen sporingGratis, ubegrænset
Smid din PDF-fil her
eller klik for at vælge en fil

Sådan bruges

  1. Slip din PDF-fil.
  2. Vælg dokumentets sprog fra rullemenuen.
  3. Tesseract.js indlæser sprogdataene (~10 MB pr. sprog, cachelagret efter første brug).
  4. OCR kører lokalt, og TXT-output tilbydes til download.

Ofte stillede spørgsmål

Hvor nøjagtig er OCR?

Tesseract er en af ​​de bedste open source OCR-motorer. For ren, moderne tekst er den typisk 95-99 % nøjagtig. Håndskrift, lavkontrastscanninger eller usædvanlige skrifttyper kan reducere nøjagtigheden betydeligt.

Hvorfor tager den første konvertering et stykke tid?

Den første kørsel downloader ~10-15 MB sprogdata. Derefter cachelagres den for resten af ​​din session.

Uploader mit dokument eller billede til en server?

Nej. Konvertering kører udelukkende i din browser ved hjælp af WebAssembly og Web API'er. Åbn fanen Netværk i DevTools, mens du konverterer - du vil ikke se nogen udgående trafik, der bærer din fil.

Er dette virkelig gratis?

Ja. Ingen tilmelding, ingen kvote, ingen opgraderingsniveau. Konverteringen kører på din maskine, så det koster os ikke noget at hoste.