Specialized converter · kjører 100 % i nettleseren din
PDF til TXT OCR
Trekk ut tekst fra en skannet eller bildebasert PDF ved hjelp av OCR (Tesseract.js + pdf.js). Hver side gjengis til et lerret og OCR'd. Fungerer for dokumenter der teksten ikke er valgbar. Fremdrift på flere sider vises mens konverteringen kjører.
Hvordan bruke
- Slipp PDF-filen.
- Velg dokumentets språk fra rullegardinmenyen.
- Tesseract.js laster språkdataene (~10 MB per språk, bufret etter første gangs bruk).
- OCR kjører lokalt og TXT-utgangen tilbys for nedlasting.
Vanlige spørsmål
Hvor nøyaktig er OCR?
Tesseract er en av de beste OCR-motorene med åpen kildekode. For ren, moderne tekst er den vanligvis 95–99 % nøyaktig. Håndskrift, skanninger med lav kontrast eller uvanlige skrifter kan redusere nøyaktigheten betraktelig.
Hvorfor tar den første konverteringen en stund?
Den første kjøringen laster ned ~10-15 MB språkdata. Etter det bufres den for resten av økten.
Laster dokumentet eller bildet mitt opp til en server?
Nei. Konvertering kjører utelukkende i nettleseren din ved hjelp av WebAssembly og Web APIer. Åpne Nettverk-fanen i DevTools mens du konverterer – du vil ikke se noen utgående trafikk som bærer filen din.
Er dette virkelig gratis?
Ja. Ingen registrering, ingen kvote, ingen oppgraderingsnivå. Konverteringen kjører på din maskin, så det koster oss ingenting å være vert for.