বিশেষায়িত রূপান্তরকারী · আপনার ব্রাউজারে 100% চলে
PDF থেকে TXT OCR
OCR (Tesseract.js + pdf.js) ব্যবহার করে একটি স্ক্যান করা বা চিত্র-ভিত্তিক PDF থেকে পাঠ্য বের করুন। প্রতিটি পৃষ্ঠা একটি ক্যানভাসে রেন্ডার করা হয় এবং OCR'd করা হয়। নথিগুলির জন্য কাজ করে যেখানে পাঠ্য নির্বাচনযোগ্য নয়। বহু-পৃষ্ঠা অগ্রগতি রূপান্তর রান হিসাবে দেখানো হয়.
কিভাবে ব্যবহার করবেন
- আপনার পিডিএফ ফাইল ড্রপ করুন।
- ড্রপডাউন থেকে নথির ভাষা বেছে নিন।
- Tesseract.js ভাষা ডেটা লোড করে (প্রতি ভাষা ~10 MB, প্রথম ব্যবহারের পরে ক্যাশে)।
- OCR স্থানীয়ভাবে চলে এবং TXT আউটপুট ডাউনলোডের জন্য দেওয়া হয়।
FAQ
OCR কতটা সঠিক?
Tesseract হল অন্যতম সেরা ওপেন সোর্স OCR ইঞ্জিন। পরিষ্কার, আধুনিক পাঠ্যের জন্য এটি সাধারণত 95-99% নির্ভুল। হস্তাক্ষর, কম-কনট্রাস্ট স্ক্যান, বা অস্বাভাবিক ফন্ট সঠিকতা উল্লেখযোগ্যভাবে হ্রাস করতে পারে।
কেন প্রথম রূপান্তর একটু সময় নেয়?
প্রথম রান ~10-15 MB ভাষা ডেটা ডাউনলোড করে। এর পরে এটি আপনার বাকি সেশনের জন্য ক্যাশে করা হয়েছে।
আমার নথি বা ছবি কি কোনো সার্ভারে আপলোড করে?
না। রূপান্তর সম্পূর্ণরূপে আপনার ব্রাউজারে WebAssembly এবং Web API ব্যবহার করে চলে। আপনি রূপান্তর করার সময় DevTools-এ নেটওয়ার্ক ট্যাব খুলুন — আপনি আপনার ফাইল বহনকারী কোনো আউটবাউন্ড ট্রাফিক দেখতে পাবেন না।
এটা কি সত্যিই বিনামূল্যে?
হ্যাঁ। কোন সাইন আপ, কোন কোটা, কোন আপগ্রেড স্তর. রূপান্তরটি আপনার মেশিনে চলে, তাই এটি হোস্ট করতে আমাদের কিছুই খরচ হয় না।