مبدل تخصصی · 100% در مرورگر شما اجرا می شود
PDF به TXT OCR
متن را از PDF اسکن شده یا مبتنی بر تصویر با استفاده از OCR (Tesseract.js + pdf.js) استخراج کنید. هر صفحه به یک بوم و OCR ارائه می شود. برای اسنادی که متن قابل انتخاب نیست کار می کند. پیشرفت چند صفحه ای با انجام تبدیل نشان داده می شود.
نحوه استفاده
- فایل PDF خود را رها کنید.
- زبان سند را از منوی کشویی انتخاب کنید.
- Tesseract.js داده های زبان را بارگیری می کند (~ 10 مگابایت در هر زبان، پس از اولین استفاده در حافظه پنهان ذخیره می شود).
- OCR به صورت محلی اجرا می شود و خروجی TXT برای دانلود ارائه می شود.
سوالات متداول
OCR چقدر دقیق است؟
Tesseract یکی از بهترین موتورهای OCR منبع باز است. برای متن تمیز و مدرن، معمولاً 95-99٪ دقیق است. دست خط، اسکن با کنتراست کم، یا فونت های غیر معمول می تواند دقت را به میزان قابل توجهی کاهش دهد.
چرا اولین تبدیل کمی طول می کشد؟
اولین اجرا 10-15 مگابایت داده زبان دانلود می کند. پس از آن برای بقیه جلسه شما ذخیره می شود.
آیا سند یا تصویر من در سرور آپلود می شود؟
خیر. تبدیل به طور کامل در مرورگر شما با استفاده از WebAssembly و Web API اجرا می شود. هنگام تبدیل، تب Network را در DevTools باز کنید — هیچ ترافیک خروجی که فایل شما را حمل می کند، مشاهده نخواهید کرد.
آیا این واقعا رایگان است؟
بله. بدون ثبت نام، بدون سهمیه، بدون سطح ارتقاء. تبدیل بر روی دستگاه شما اجرا می شود، بنابراین هزینه ای برای میزبانی ما ندارد.