Erikoistunut muuntaja · toimii 100 % selaimessasi
Kuva TXT OCR:ään
Pura tekstiä kuvasta (kuvakaappaus, skannaus, valokuva) käyttämällä Tesseract.js:ää – WebAssemblyyn käännettyä avoimen lähdekoodin OCR-moottoria. Tukee 14 yleistä kieltä. Koko OCR-putki toimii selaimessasi. kuva ei koskaan lataudu.
Kuinka käyttää
- Pudota kuvatiedosto.
- Valitse asiakirjan kieli pudotusvalikosta.
- Tesseract.js lataa kielitiedot (noin 10 Mt kieltä kohden, välimuistissa ensimmäisen käytön jälkeen).
- OCR toimii paikallisesti ja TXT-lähtö tarjotaan ladattavaksi.
UKK
Kuinka tarkka OCR on?
Tesseract on yksi parhaista avoimen lähdekoodin OCR-moottoreista. Puhtaalle, nykyaikaiselle tekstille se on yleensä 95–99 % tarkka. Käsinkirjoitus, vähäkontrastiset skannaukset tai epätavalliset fontit voivat heikentää tarkkuutta merkittävästi.
Miksi ensimmäinen muunnos kestää jonkin aikaa?
Ensimmäinen ajo lataa ~10-15 Mt kielidataa. Sen jälkeen se tallennetaan välimuistiin koko istunnon ajan.
Ladataanko asiakirjani tai kuvani palvelimelle?
Ei. Muunnos suoritetaan kokonaan selaimessasi WebAssemblyn ja Web API:n avulla. Avaa Verkko-välilehti DevToolsissa muuntamisen aikana – et näe lähtevää liikennettä, joka kuljettaa tiedostoa.
Onko tämä todella ilmainen?
Kyllä. Ei rekisteröitymistä, ei kiintiötä, ei päivitystasoa. Muunnos suoritetaan koneellasi, joten isännöinti ei maksa meille mitään.