Özel dönüştürücü · tarayıcınızda %100 çalışır
PDF'den TXT OCR'ye
OCR (Tesseract.js + pdf.js) kullanarak taranmış veya görüntü tabanlı bir PDF'den metin çıkarın. Her sayfa bir tuvale dönüştürülür ve OCR'lanır. Metnin seçilemediği belgelerde çalışır. Dönüşüm çalıştırılırken çok sayfalı ilerleme gösterilir.
Nasıl kullanılır?
- PDF dosyanızı bırakın.
- Açılır menüden belgenin dilini seçin.
- Tesseract.js dil verilerini yükler (dil başına ~10 MB, ilk kullanımdan sonra önbelleğe alınır).
- OCR yerel olarak çalışır ve TXT çıkışı indirilmeye sunulur.
SSS
OCR ne kadar doğrudur?
Tesseract en iyi açık kaynaklı OCR motorlarından biridir. Temiz, modern metinler için genellikle %95-99 doğrudur. El yazısı, düşük kontrastlı taramalar veya olağandışı yazı tipleri doğruluğu önemli ölçüde düşürebilir.
İlk dönüşüm neden biraz zaman alıyor?
İlk çalıştırmada ~10-15 MB dil verisi indirilir. Bundan sonra oturumunuzun geri kalanı için önbelleğe alınır.
Belgem veya görselim bir sunucuya yükleniyor mu?
Hayır. Dönüştürme, WebAssembly ve Web API'leri kullanılarak tamamen tarayıcınızda çalışır. Dönüştürme işlemi sırasında DevTools'ta Ağ sekmesini açın; dosyanızı taşıyan hiçbir giden trafik görmezsiniz.
Bu gerçekten ücretsiz mi?
Evet. Kayıt yok, kota yok, yükseltme katmanı yok. Dönüşüm makinenizde çalışır, dolayısıyla barındırmanın bize hiçbir maliyeti yoktur.