အထူးပြုပြောင်းစက် · သင့်ဘရောက်ဆာတွင် 100% လုပ်ဆောင်သည်။
PDF သို့ TXT OCR
OCR (Tesseract.js + pdf.js) ကို အသုံးပြု၍ စကင်န်ဖတ်ထားသော သို့မဟုတ် ပုံအခြေခံ PDF မှ စာသားကို ထုတ်ယူပါ။ စာမျက်နှာတစ်ခုစီကို ကင်းဗတ်စ်နှင့် OCR'd အဖြစ် ပြန်ဆိုသည်။ စာသားကို ရွေးချယ်၍မရသော စာရွက်စာတမ်းများအတွက် အလုပ်လုပ်သည်။ ပြောင်းလဲခြင်း လုပ်ဆောင်နေချိန်တွင် စာမျက်နှာများစွာ တိုးတက်မှုကို ပြသထားသည်။
အသုံးပြုပုံ
- သင်၏ PDF ဖိုင်ကို ချလိုက်ပါ။
- dropdown မှ စာရွက်စာတမ်း၏ ဘာသာစကားကို ရွေးပါ။
- Tesseract.js သည် ဘာသာစကားဒေတာကို ဖွင့်ပေးသည် (ဘာသာစကားတစ်ခုလျှင် ~10 MB၊ ပထမဆုံးအသုံးပြုပြီးနောက် ကက်ရှ်လုပ်ထားသည်)။
- OCR သည် စက်တွင်းတွင် လုပ်ဆောင်နေပြီး TXT အထွက်အား ဒေါင်းလုဒ်လုပ်ရန် ကမ်းလှမ်းထားသည်။
FAQ
OCR မည်မျှတိကျသနည်း။
Tesseract သည် အကောင်းဆုံး open-source OCR အင်ဂျင်များထဲမှ တစ်ခုဖြစ်သည်။ သန့်ရှင်းပြီး ခေတ်မီသော စာသားအတွက် ၎င်းသည် ပုံမှန်အားဖြင့် 95-99% တိကျသည်။ လက်ရေးမူ၊ ဆန့်ကျင်ဘက်နိမ့်သော စကင်န်ဖတ်ခြင်း သို့မဟုတ် ပုံမှန်မဟုတ်သော ဖောင့်များသည် တိကျမှု သိသိသာသာ ကျဆင်းသွားနိုင်သည်။
ပထမဆုံးပြောင်းလဲခြင်းသည် အဘယ်ကြောင့် အချိန်အနည်းငယ်ကြာသနည်း။
ပထမဆုံး run သည် ဘာသာစကားဒေတာ၏ ~10-15 MB ကို ဒေါင်းလုဒ်လုပ်သည်။ ထို့နောက် ကျန်ရှိသော သင့်စက်ရှင်အတွက် ၎င်းကို သိမ်းဆည်းထားသည်။
ကျွန်ုပ်၏ စာရွက်စာတမ်း သို့မဟုတ် ရုပ်ပုံကို ဆာဗာသို့ အပ်လုဒ်လုပ်ပါသလား။
နံပါတ် ပြောင်းလဲခြင်းသည် WebAssembly နှင့် Web API များကို အသုံးပြု၍ သင့်ဘရောက်ဆာတွင် လုံးလုံးလျားလျား လုပ်ဆောင်ပါသည်။ သင်ပြောင်းလဲနေစဉ်တွင် DevTools တွင် ကွန်ရက်တက်ဘ်ကိုဖွင့်ပါ — သင့်ဖိုင်ကိုသယ်ဆောင်လာသည့် အပြင်ဘက်လမ်းကြောင်းကို သင်တွေ့လိမ့်မည်မဟုတ်ပါ။
ဒါက တကယ်အခမဲ့လား။
ဟုတ်တယ်။ စာရင်းသွင်းခြင်း မရှိ၊ ခွဲတမ်းမရှိ၊ အဆင့်မြှင့်တင်မှု မရှိပါ။ ပြောင်းလဲခြင်းသည် သင့်စက်ပေါ်တွင် လုပ်ဆောင်နေသောကြောင့် ၎င်းသည် ကျွန်ုပ်တို့အား လက်ခံဆောင်ရွက်ပေးရန် ဘာမှမကုန်ကျပါ။