ตัวแปลงเฉพาะ · ทำงานได้ 100% ในเบราว์เซอร์ของคุณ
PDF เป็น TXT OCR
แยกข้อความจาก PDF ที่สแกนหรือแบบรูปภาพโดยใช้ OCR (Tesseract.js + pdf.js) แต่ละหน้าจะแสดงผลบนผืนผ้าใบและ OCR ใช้งานได้กับเอกสารที่ไม่สามารถเลือกข้อความได้ ความคืบหน้าหลายหน้าจะแสดงขึ้นในขณะที่ Conversion ดำเนินไป
วิธีใช้งาน
- วางไฟล์ PDF ของคุณ
- เลือกภาษาของเอกสารจากเมนูแบบเลื่อนลง
- Tesseract.js โหลดข้อมูลภาษา (ประมาณ 10 MB ต่อภาษา แคชหลังจากใช้งานครั้งแรก)
- OCR ทำงานภายในเครื่องและมีเอาต์พุต TXT ให้ดาวน์โหลด
คำถามที่พบบ่อย
OCR มีความแม่นยำเพียงใด?
Tesseract เป็นหนึ่งในเอ็นจิ้น OCR โอเพ่นซอร์สที่ดีที่สุด สำหรับข้อความที่ดูสะอาดตาและทันสมัย โดยทั่วไปจะมีความแม่นยำ 95-99% การเขียนด้วยลายมือ การสแกนคอนทราสต์ต่ำ หรือแบบอักษรที่ผิดปกติอาจทำให้ความแม่นยำลดลงอย่างมาก
เพราะเหตุใดการแปลงครั้งแรกจึงใช้เวลาสักครู่?
การทำงานครั้งแรกจะดาวน์โหลดข้อมูลภาษาประมาณ 10-15 MB หลังจากนั้นจะถูกแคชไว้สำหรับเซสชันที่เหลือของคุณ
เอกสารหรือรูปภาพของฉันอัปโหลดไปยังเซิร์ฟเวอร์หรือไม่
ไม่ Conversion จะทำงานทั้งหมดในเบราว์เซอร์ของคุณโดยใช้ WebAssembly และ Web API เปิดแท็บเครือข่ายใน DevTools ในขณะที่คุณแปลง คุณจะไม่เห็นการรับส่งข้อมูลขาออกที่ส่งไฟล์ของคุณ
ฟรีจริงเหรอ?
ใช่ ไม่มีการสมัคร ไม่มีโควต้า ไม่มีระดับการอัพเกรด การแปลงทำงานบนเครื่องของคุณ ดังนั้นจึงไม่มีค่าใช้จ่ายใด ๆ ในการโฮสต์