বিশেষায়িত রূপান্তরকারী · আপনার ব্রাউজারে 100% চলে

PDF থেকে TXT OCR

OCR (Tesseract.js + pdf.js) ব্যবহার করে একটি স্ক্যান করা বা চিত্র-ভিত্তিক PDF থেকে পাঠ্য বের করুন। প্রতিটি পৃষ্ঠা একটি ক্যানভাসে রেন্ডার করা হয় এবং OCR'd করা হয়। নথিগুলির জন্য কাজ করে যেখানে পাঠ্য নির্বাচনযোগ্য নয়। বহু-পৃষ্ঠা অগ্রগতি রূপান্তর রান হিসাবে দেখানো হয়.

আপলোড নেইকোন সাইনআপ নেইকোনো ট্র্যাকিং নেইবিনামূল্যে, সীমাহীন
আপনার PDF ফাইলটি এখানে ড্রপ করুন
অথবা একটি ফাইল বেছে নিতে ক্লিক করুন

কিভাবে ব্যবহার করবেন

  1. আপনার পিডিএফ ফাইল ড্রপ করুন।
  2. ড্রপডাউন থেকে নথির ভাষা বেছে নিন।
  3. Tesseract.js ভাষা ডেটা লোড করে (প্রতি ভাষা ~10 MB, প্রথম ব্যবহারের পরে ক্যাশে)।
  4. OCR স্থানীয়ভাবে চলে এবং TXT আউটপুট ডাউনলোডের জন্য দেওয়া হয়।

FAQ

OCR কতটা সঠিক?

Tesseract হল অন্যতম সেরা ওপেন সোর্স OCR ইঞ্জিন। পরিষ্কার, আধুনিক পাঠ্যের জন্য এটি সাধারণত 95-99% নির্ভুল। হস্তাক্ষর, কম-কনট্রাস্ট স্ক্যান, বা অস্বাভাবিক ফন্ট সঠিকতা উল্লেখযোগ্যভাবে হ্রাস করতে পারে।

কেন প্রথম রূপান্তর একটু সময় নেয়?

প্রথম রান ~10-15 MB ভাষা ডেটা ডাউনলোড করে। এর পরে এটি আপনার বাকি সেশনের জন্য ক্যাশে করা হয়েছে।

আমার নথি বা ছবি কি কোনো সার্ভারে আপলোড করে?

না। রূপান্তর সম্পূর্ণরূপে আপনার ব্রাউজারে WebAssembly এবং Web API ব্যবহার করে চলে। আপনি রূপান্তর করার সময় DevTools-এ নেটওয়ার্ক ট্যাব খুলুন — আপনি আপনার ফাইল বহনকারী কোনো আউটবাউন্ড ট্রাফিক দেখতে পাবেন না।

এটা কি সত্যিই বিনামূল্যে?

হ্যাঁ। কোন সাইন আপ, কোন কোটা, কোন আপগ্রেড স্তর. রূপান্তরটি আপনার মেশিনে চলে, তাই এটি হোস্ট করতে আমাদের কিছুই খরচ হয় না।