Specialized converter · körs 100 % i din webbläsare
PDF till TXT OCR
Extrahera text från en skannad eller bildbaserad PDF med OCR (Tesseract.js + pdf.js). Varje sida renderas till en duk och OCR'd. Fungerar för dokument där texten inte är valbar. Flersidiga framsteg visas när konverteringen körs.
Hur man använder
- Släpp din PDF-fil.
- Välj dokumentets språk från rullgardinsmenyn.
- Tesseract.js laddar språkdata (~10 MB per språk, cachad efter första användning).
- OCR körs lokalt och TXT-utgången erbjuds för nedladdning.
Vanliga frågor
Hur exakt är OCR?
Tesseract är en av de bästa OCR-motorerna med öppen källkod. För ren, modern text är den vanligtvis 95-99 % korrekt. Handskrift, skanningar med låg kontrast eller ovanliga teckensnitt kan minska noggrannheten avsevärt.
Varför tar den första konverteringen ett tag?
Den första körningen laddar ner ~10-15 MB språkdata. Därefter cachelagras den för resten av din session.
Laddas mitt dokument eller min bild upp till en server?
Nej. Konverteringen körs helt och hållet i din webbläsare med hjälp av WebAssembly och webb-API:er. Öppna fliken Nätverk i DevTools medan du konverterar — du ser ingen utgående trafik som bär din fil.
Är detta verkligen gratis?
Ja. Ingen registrering, ingen kvot, ingen uppgraderingsnivå. Konverteringen körs på din maskin, så det kostar oss ingenting att vara värd.