Özel dönüştürücü · tarayıcınızda %100 çalışır

PDF'den TXT OCR'ye

OCR (Tesseract.js + pdf.js) kullanarak taranmış veya görüntü tabanlı bir PDF'den metin çıkarın. Her sayfa bir tuvale dönüştürülür ve OCR'lanır. Metnin seçilemediği belgelerde çalışır. Dönüşüm çalıştırılırken çok sayfalı ilerleme gösterilir.

Yükleme yokKayıt yokİzleme yokÜcretsiz, sınırsız
PDF dosyanızı buraya bırakın
veya bir dosya seçmek için tıklayın

Nasıl kullanılır?

  1. PDF dosyanızı bırakın.
  2. Açılır menüden belgenin dilini seçin.
  3. Tesseract.js dil verilerini yükler (dil başına ~10 MB, ilk kullanımdan sonra önbelleğe alınır).
  4. OCR yerel olarak çalışır ve TXT çıkışı indirilmeye sunulur.

SSS

OCR ne kadar doğrudur?

Tesseract en iyi açık kaynaklı OCR motorlarından biridir. Temiz, modern metinler için genellikle %95-99 doğrudur. El yazısı, düşük kontrastlı taramalar veya olağandışı yazı tipleri doğruluğu önemli ölçüde düşürebilir.

İlk dönüşüm neden biraz zaman alıyor?

İlk çalıştırmada ~10-15 MB dil verisi indirilir. Bundan sonra oturumunuzun geri kalanı için önbelleğe alınır.

Belgem veya görselim bir sunucuya yükleniyor mu?

Hayır. Dönüştürme, WebAssembly ve Web API'leri kullanılarak tamamen tarayıcınızda çalışır. Dönüştürme işlemi sırasında DevTools'ta Ağ sekmesini açın; dosyanızı taşıyan hiçbir giden trafik görmezsiniz.

Bu gerçekten ücretsiz mi?

Evet. Kayıt yok, kota yok, yükseltme katmanı yok. Dönüşüm makinenizde çalışır, dolayısıyla barındırmanın bize hiçbir maliyeti yoktur.