Specialized converter · tumatakbo nang 100% sa iyong browser

PDF to Searchable PDF OCR

Magdagdag ng invisible na layer ng teksto ng OCR sa isang na-scan na PDF upang ito ay maging nahahanap + na-index habang pinapanatili ang mga orihinal na larawan ng pahina. Ang bawat pahina ay nai-render, OCR'd, at itinayong muli gamit ang tekstong inilatag sa ibabaw ng larawan sa tamang mga coordinate. Ang output ay isang karaniwang PDF na nagbubukas sa anumang mambabasa. Ang

Walang pag-uploadWalang pag-signupWalang pagsubaybayLibre, walang limitasyon
I-drop ang iyong PDF file dito
o i-click upang pumili ng file

Paano gamitin

  1. I-drop ang iyong PDF file.
  2. Piliin ang wika ng dokumento mula sa dropdown.
  3. Nilo-load ng Tesseract.js ang data ng wika (~10 MB bawat wika, naka-cache pagkatapos ng unang paggamit).
  4. OCR ay tumatakbo nang lokal at ang Nahahanap na PDF na output ay iniaalok para sa pag-download.

FAQ

Gaano katumpak ang OCR?

Ang Tesseract ay isa sa pinakamahusay na open-source na OCR engine. Para sa malinis, modernong teksto, kadalasang 95-99% ang tumpak. Ang sulat-kamay, mababang-contrast na mga pag-scan, o hindi pangkaraniwang mga font ay maaaring makabuluhang bawasan ang katumpakan.

Bakit nagtatagal ang unang conversion?

Ang unang pagtakbo ay nagda-download ng ~10-15 MB ng data ng wika. Pagkatapos nito, naka-cache na ito para sa natitirang bahagi ng iyong session.

Nag-a-upload ba ang aking dokumento o larawan sa isang server?

Hindi. Ganap na tumatakbo ang conversion sa iyong browser gamit ang WebAssembly at Web API. Buksan ang tab na Network sa DevTools habang nagko-convert ka — wala kang makikitang papalabas na trapiko na nagdadala ng iyong file.

Libre ba talaga ito?

Oo. Walang signup, walang quota, walang upgrade tier. Ang conversion ay tumatakbo sa iyong makina, kaya wala kaming gastos sa pag-host.