Trình chuyển đổi chuyên dụng · chạy 100% trong trình duyệt của bạn

PDF sang PDF OCR có thể tìm kiếm

Thêm lớp văn bản OCR vô hình vào tệp PDF được quét để nó có thể tìm kiếm + lập chỉ mục được trong khi vẫn giữ hình ảnh trang gốc. Mỗi trang được hiển thị, OCR'd và được xây dựng lại với văn bản được đặt trên hình ảnh ở tọa độ chính xác. Đầu ra là một tệp PDF tiêu chuẩn có thể mở được trong bất kỳ trình đọc nào.

Không tải lênKhông đăng kýKhông theo dõiMiễn phí, không giới hạn
Thả tệp PDF của bạn vào đây
hoặc nhấp để chọn file

Cách sử dụng

  1. Hãy thả tập tin PDF của bạn xuống.
  2. Chọn ngôn ngữ của tài liệu từ danh sách thả xuống.
  3. Tesseract.js tải dữ liệu ngôn ngữ (~10 MB mỗi ngôn ngữ, được lưu vào bộ đệm sau lần sử dụng đầu tiên).
  4. OCR chạy cục bộ và đầu ra PDF có thể tìm kiếm được cung cấp để tải xuống.

Câu hỏi thường gặp

OCR chính xác đến mức nào?

Tesseract là một trong những công cụ OCR nguồn mở tốt nhất. Để có văn bản rõ ràng, hiện đại, độ chính xác thường là 95-99%. Chữ viết tay, quét có độ tương phản thấp hoặc phông chữ bất thường có thể làm giảm độ chính xác đáng kể.

Tại sao lần chuyển đổi đầu tiên lại mất một khoảng thời gian?

Lần chạy đầu tiên tải xuống ~10-15 MB dữ liệu ngôn ngữ. Sau đó, nó được lưu vào bộ nhớ đệm cho phần còn lại của phiên của bạn.

Tài liệu hoặc hình ảnh của tôi có tải lên máy chủ không?

Không. Quá trình chuyển đổi chạy hoàn toàn trong trình duyệt của bạn bằng cách sử dụng WebAssembly và API Web. Mở tab Mạng trong DevTools trong khi chuyển đổi — bạn sẽ không thấy lưu lượng truy cập đi nào mang theo tệp của mình.

Cái này có thực sự miễn phí không?

Vâng. Không đăng ký, không hạn ngạch, không nâng cấp. Quá trình chuyển đổi diễn ra trên máy của bạn nên chúng tôi không mất phí lưu trữ.