専用コンバーター・100% ブラウザ内で動作
PDF→検索可能PDF OCR
スキャンしたPDFに見えないOCRテキストレイヤーを追加し、元のページ画像を保ったまま検索・インデックス可能にします。各ページはレンダリングしてOCRし、正しい座標で画像の上にテキストを重ねて再構築します。出力はどのリーダーでも開ける標準的なPDFです。
アップロードなし登録不要トラッキングなし無料・無制限
PDFファイルをここにドロップ
またはクリックしてファイルを選択
使い方
- PDFファイルをドロップ。
- ドロップダウンから文書の言語を選択。
- Tesseract.jsが言語データ(1言語あたり約10 MB、初回利用後はキャッシュ)を読み込みます。
- OCRがローカルで実行され、検索可能PDFの出力がダウンロード用に提供されます。
よくある質問
OCRの精度はどのくらいですか?
Tesseractは最良クラスのオープンソースOCRエンジンの1つです。きれいで現代的なテキストなら通常95〜99%の精度です。手書き、低コントラストのスキャン、珍しいフォントでは精度が大きく下がることがあります。
初回の変換に時間がかかるのはなぜですか?
初回実行時に約10〜15 MBの言語データをダウンロードします。その後はセッション中ずっとキャッシュされます。
ドキュメントや画像はサーバーにアップロードされますか?
いいえ。変換は WebAssembly と Web API を使ってすべてブラウザ内で実行されます。変換中に DevTools の Network タブを開いてみてください。ファイルを運ぶ送信トラフィックは見当たりません。
これは本当に無料ですか?
はい。登録なし、上限なし、アップグレードプランもありません。変換はあなたのマシン上で実行されるため、私たちのホスティング費用はゼロです。