How accurate is the OCR?

Tesseract is one of the best open-source OCR engines. For clean, modern text it's typically 95-99% accurate. Handwriting, low-contrast scans, or unusual fonts can drop accuracy significantly.

Why does the first conversion take a while?

The first run downloads ~10-15 MB of language data. After that it's cached for the rest of your session.

Does my document or image upload to a server?

No. Conversion runs entirely in your browser using WebAssembly and Web APIs. Open the Network tab in DevTools while you convert — you'll see no outbound traffic carrying your file.

Yes. No signup, no quota, no upgrade tier. The conversion runs on your machine, so it costs us nothing to host.

専用コンバータ · ブラウザで 100% 動作します

PDF から TXT OCR へ

OCR (Tesseract.js + pdf.js) を使用して、スキャンされた PDF または画像ベースの PDF からテキストを抽出します。各ページはキャンバスにレンダリングされ、OCR 処理されます。テキストが選択できない文書に有効です。変換の実行中に複数ページの進行状況が表示されます。

アップロードなしサインアップはありません追跡なし無料、無制限

ここに PDF ファイルをドロップしてください

またはクリックしてファイルを選択します

言語

使用方法

PDF ファイルをドロップします。
ドロップダウンからドキュメントの言語を選択します。
Tesseract.js は言語データを読み込みます (言語あたり最大 10 MB、最初の使用後にキャッシュされます)。
OCR はローカルで実行され、TXT 出力はダウンロード用に提供されます。

よくある質問

OCR の精度はどのくらいですか?

Tesseract は、最高のオープンソース OCR エンジンの 1 つです。きれいで現代的なテキストの場合、通常は 95 ～ 99% の精度です。手書き、低コントラストのスキャン、または珍しいフォントを使用すると、精度が大幅に低下する可能性があります。

最初の変換に時間がかかるのはなぜですか?

最初の実行では、約 10 ～ 15 MB の言語データがダウンロードされます。その後、セッションの残りの間キャッシュされます。

私のドキュメントまたは画像はサーバーにアップロードされますか?

いいえ。変換は WebAssembly と Web API を使用してブラウザ内で完全に実行されます。変換中に DevTools の [ネットワーク] タブを開きます。ファイルを運ぶ送信トラフィックがないことがわかります。

これは本当に無料ですか?

はい。サインアップ、割り当て、アップグレード層はありません。変換はお客様のマシン上で実行されるため、ホストに費用はかかりません。