Specialized converter · tumatakbo nang 100% sa iyong browser

PDF sa TXT OCR

I-extract ang text mula sa isang na-scan o nakabatay sa larawan na PDF gamit ang OCR (Tesseract.js + pdf.js). Ang bawat pahina ay nai-render sa isang canvas at OCR'd. Gumagana para sa mga dokumento kung saan ang teksto ay hindi mapipili. Ang pag-unlad ng maraming pahina ay ipinapakita habang tumatakbo ang conversion.

Walang pag-uploadWalang pag-signupWalang pagsubaybayLibre, walang limitasyon
I-drop ang iyong PDF file dito
o i-click upang pumili ng file

Paano gamitin

  1. I-drop ang iyong PDF file.
  2. Piliin ang wika ng dokumento mula sa dropdown.
  3. Nilo-load ng Tesseract.js ang data ng wika (~10 MB bawat wika, naka-cache pagkatapos ng unang paggamit).
  4. Ang OCR ay lokal na tumatakbo at ang TXT output ay inaalok para sa pag-download.

FAQ

Gaano katumpak ang OCR?

Ang Tesseract ay isa sa pinakamahusay na open-source na OCR engine. Para sa malinis, modernong teksto, kadalasang 95-99% ang tumpak. Ang sulat-kamay, mababang-contrast na mga pag-scan, o hindi pangkaraniwang mga font ay maaaring makabuluhang bawasan ang katumpakan.

Bakit nagtatagal ang unang conversion?

Ang unang pagtakbo ay nagda-download ng ~10-15 MB ng data ng wika. Pagkatapos nito, naka-cache na ito para sa natitirang bahagi ng iyong session.

Nag-a-upload ba ang aking dokumento o larawan sa isang server?

Hindi. Ganap na tumatakbo ang conversion sa iyong browser gamit ang WebAssembly at Web API. Buksan ang tab na Network sa DevTools habang nagko-convert ka — wala kang makikitang papalabas na trapiko na nagdadala ng iyong file.

Libre ba talaga ito?

Oo. Walang signup, walang quota, walang upgrade tier. Ang conversion ay tumatakbo sa iyong makina, kaya wala kaming gastos sa pag-host.