Özel dönüştürücü · %100 tarayıcınızda çalışır
PDF'den TXT OCR
OCR (Tesseract.js + pdf.js) kullanarak taranan veya görüntü tabanlı bir PDF'den metin çıkarın. Her sayfa bir canvas'a işlenir ve OCR uygulanır. Metnin seçilemediği belgeler için çalışır. Dönüşüm sırasında çok sayfalı ilerleme gösterilir.
Nasıl kullanılır
- PDF dosyanızı bırakın.
- Açılır menüden belgenin dilini seçin.
- Tesseract.js, dil verisini yükler (dil başına ~10 MB, ilk kullanımdan sonra önbelleğe alınır).
- OCR yerel olarak çalışır ve TXT çıktısı indirme için sunulur.
SSS
OCR ne kadar doğru?
Tesseract, en iyi açık kaynaklı OCR motorlarından biridir. Temiz ve modern metin için genellikle %95-99 doğruluk sağlar. El yazısı, düşük kontrastlı taramalar veya alışılmadık yazı tipleri doğruluğu önemli ölçüde düşürebilir.
İlk dönüşüm neden biraz zaman alıyor?
İlk çalıştırma ~10-15 MB dil verisi indirir. Sonrasında oturumunuzun geri kalanı için önbelleğe alınır.
Belgem veya görüntüm bir sunucuya yükleniyor mu?
Hayır. Dönüşüm, WebAssembly ve Web API'leri kullanılarak tamamen tarayıcınızda çalışır. Dönüştürme sırasında DevTools'ta Network sekmesini açın — dosyanızı taşıyan giden trafik görmeyeceksiniz.
Bu gerçekten ücretsiz mi?
Evet. Kayıt yok, kota yok, yükseltme kademesi yok. Dönüşüm makinenizde çalışır, bu nedenle barındırma maliyetimiz sıfırdır.