ตัวแปลงเฉพาะ · ทำงานได้ 100% ในเบราว์เซอร์ของคุณ

PDF เป็น TXT OCR

แยกข้อความจาก PDF ที่สแกนหรือแบบรูปภาพโดยใช้ OCR (Tesseract.js + pdf.js) แต่ละหน้าจะแสดงผลบนผืนผ้าใบและ OCR ใช้งานได้กับเอกสารที่ไม่สามารถเลือกข้อความได้ ความคืบหน้าหลายหน้าจะแสดงขึ้นในขณะที่ Conversion ดำเนินไป

ไม่มีการอัปโหลดไม่มีการสมัครไม่มีการติดตามฟรี ไม่จำกัด
วางไฟล์ PDF ของคุณที่นี่
หรือคลิกเพื่อเลือกไฟล์

วิธีใช้งาน

  1. วางไฟล์ PDF ของคุณ
  2. เลือกภาษาของเอกสารจากเมนูแบบเลื่อนลง
  3. Tesseract.js โหลดข้อมูลภาษา (ประมาณ 10 MB ต่อภาษา แคชหลังจากใช้งานครั้งแรก)
  4. OCR ทำงานภายในเครื่องและมีเอาต์พุต TXT ให้ดาวน์โหลด

คำถามที่พบบ่อย

OCR มีความแม่นยำเพียงใด?

Tesseract เป็นหนึ่งในเอ็นจิ้น OCR โอเพ่นซอร์สที่ดีที่สุด สำหรับข้อความที่ดูสะอาดตาและทันสมัย ​​โดยทั่วไปจะมีความแม่นยำ 95-99% การเขียนด้วยลายมือ การสแกนคอนทราสต์ต่ำ หรือแบบอักษรที่ผิดปกติอาจทำให้ความแม่นยำลดลงอย่างมาก

เพราะเหตุใดการแปลงครั้งแรกจึงใช้เวลาสักครู่?

การทำงานครั้งแรกจะดาวน์โหลดข้อมูลภาษาประมาณ 10-15 MB หลังจากนั้นจะถูกแคชไว้สำหรับเซสชันที่เหลือของคุณ

เอกสารหรือรูปภาพของฉันอัปโหลดไปยังเซิร์ฟเวอร์หรือไม่

ไม่ Conversion จะทำงานทั้งหมดในเบราว์เซอร์ของคุณโดยใช้ WebAssembly และ Web API เปิดแท็บเครือข่ายใน DevTools ในขณะที่คุณแปลง คุณจะไม่เห็นการรับส่งข้อมูลขาออกที่ส่งไฟล์ของคุณ

ฟรีจริงเหรอ?

ใช่ ไม่มีการสมัคร ไม่มีโควต้า ไม่มีระดับการอัพเกรด การแปลงทำงานบนเครื่องของคุณ ดังนั้นจึงไม่มีค่าใช้จ่ายใด ๆ ในการโฮสต์