প্রচলিত অনুলিপি ব্যবহার করে একটি পিডিএফ ফাইল থেকে পাঠ্যটি সরাতে সর্বদা সম্ভব নয়। প্রায়শই এমন নথিগুলির পৃষ্ঠাগুলি তাদের কাগজের সংস্করণগুলির স্ক্যান করা সামগ্রী। সম্পূর্ণরূপে সম্পাদনাযোগ্য টেক্সট ডেটাতে যেমন ফাইলগুলি রূপান্তর করতে, অপটিক্যাল ক্যারেক্টার রেকগনিশন (ওসিআর) ফাংশনগুলির সাথে বিশেষ প্রোগ্রাম ব্যবহার করা হয়।
এই ধরনের সমাধান বাস্তবায়ন খুব কঠিন এবং অতএব, অনেক টাকা খরচ। যদি আপনি নিয়মিত পিডিএফ সহ পাঠ্য সনাক্ত করতে চান তবে উপযুক্ত প্রোগ্রামটি কেনার পরামর্শ দেওয়া হয়। বিরল ক্ষেত্রে, অনুরূপ ফাংশনগুলির সাথে উপলব্ধ অনলাইন পরিষেবাদিগুলির একটি ব্যবহার করার জন্য এটি আরো যৌক্তিক হবে।
অনলাইন পিডিএফ থেকে টেক্সট চিনতে কিভাবে
অবশ্যই, ওসিআর অনলাইন সেবা ফিচার সেট পূর্ণ ডেস্কটপ সমাধানগুলির তুলনায় আরও সীমিত। তবে আপনি এই ধরনের সংস্থানগুলির সাথে বিনামূল্যে বা কোনও ফ্যামিলির জন্য কাজ করতে পারেন। মূল বিষয় হচ্ছে সংশ্লিষ্ট ওয়েব অ্যাপ্লিকেশনগুলির পাশাপাশি টেক্সট স্বীকৃতির সাথে তাদের মূল কাজটি মোকাবিলা করা।
পদ্ধতি 1: ABBYY FineReader অনলাইন
সেবা উন্নয়ন সংস্থা অপটিক্যাল নথি স্বীকৃতি ক্ষেত্রে নেতাদের মধ্যে একটি। উইন্ডোজ এবং ম্যাকের জন্য ABBYY FineReader PDF এ পাঠ্য রূপান্তর এবং এর সাথে কাজ করার জন্য একটি শক্তিশালী সমাধান।
প্রোগ্রামটির ওয়েব প্রতিপক্ষ কার্যকরীভাবে এটির চেয়ে কম। তবুও, পরিষেবাটি 190 টিরও বেশি ভাষায় স্ক্যান এবং ফটোগুলি থেকে পাঠ্য সনাক্ত করতে পারে। নথি, শব্দ, এক্সেল ইত্যাদিতে পিডিএফ ফাইল রূপান্তর সমর্থন করে।
ABBYY FineReader অনলাইন অনলাইন সেবা
- আপনি টুল দিয়ে কাজ শুরু করার আগে, সাইটে একটি অ্যাকাউন্ট তৈরি করুন অথবা আপনার ফেসবুক, গুগল বা মাইক্রোসফ্ট অ্যাকাউন্ট ব্যবহার করে লগ ইন করুন।
লগইন উইন্ডোতে যেতে বোতামে ক্লিক করুন। "লগইন" উপরের মেনু বারে। - একবার লগ ইন করে, বোতাম ব্যবহার করে FineReader এ পছন্দসই PDF নথি আমদানি করুন "ফাইল আপলোড করুন".
তারপর ক্লিক করুন "পৃষ্ঠা নম্বর নির্বাচন করুন" এবং টেক্সট স্বীকৃতি জন্য পছন্দসই স্প্যান উল্লেখ করুন। - এরপরে, নথিতে উপস্থিত ভাষাগুলি নির্বাচন করুন, ফলে ফাইলের বিন্যাস এবং বাটনে ক্লিক করুন "চিনতে পারা".
- প্রক্রিয়াকরণের পরে, যে সময়কাল সম্পূর্ণরূপে নথির আকারের উপর নির্ভর করে, আপনি কেবলমাত্র নামের নামের উপর ক্লিক করে শেষ হওয়া ফাইলটিকে টেক্সট ডেটা দিয়ে ডাউনলোড করতে পারেন।
অথবা উপলব্ধ মেঘ পরিষেবা এক এটি রপ্তানি।
পরিষেবাটি চিত্র এবং PDF ফাইলে সবচেয়ে সঠিক পাঠ স্বীকৃতি অ্যালগরিদমগুলি দ্বারা, সম্ভবত, আলাদা হয়। কিন্তু, দুর্ভাগ্যক্রমে, এটির বিনামূল্যে ব্যবহার প্রতি মাসে প্রসারিত পাঁচটি পৃষ্ঠাতে সীমাবদ্ধ। আরো বৃহত্তর নথির সাথে কাজ করার জন্য আপনাকে এক বছরের সাবস্ক্রিপশন কিনতে হবে।
যাইহোক, যদি ওসিআর ফাংশন খুব কমই প্রয়োজন হয়, ABBYY FineReader Online ছোট PDF ফাইলগুলি থেকে পাঠ্য নিষ্কাশন করার জন্য একটি দুর্দান্ত বিকল্প।
পদ্ধতি 2: ফ্রি অনলাইন ওসিআর
টেক্সট digitizing জন্য সহজ এবং সুবিধাজনক সেবা। নিবন্ধনের প্রয়োজন ছাড়া, সম্পদটি প্রতি ঘন্টায় 15 টি পূর্ণ PDF-পৃষ্ঠাগুলি চিনতে পারবেন। ফ্রি অনলাইন ওসিআর 46 টি ভাষায় ডকুমেন্টগুলির সাথে সম্পূর্ণভাবে কাজ করে এবং অনুমোদন ছাড়াই তিনটি টেক্সট রপ্তানি বিন্যাস - ডওক্সএক্স, এক্সএলএসএক্স এবং টিXT সমর্থন করে।
নিবন্ধন করার সময়, ব্যবহারকারী মাল্টি পৃষ্ঠা নথি প্রক্রিয়া করতে সক্ষম, কিন্তু এই পৃষ্ঠাগুলির বিনামূল্যে সংখ্যা 50 ইউনিট সীমাবদ্ধ।
ফ্রি অনলাইন ওসিআর অনলাইন সেবা
- পিডিএফ থেকে পাঠ্যকে "গেস্ট" হিসাবে স্বীকৃতি ছাড়াই, স্বত্বের অনুমোদন ছাড়া, সাইটের মূল পৃষ্ঠায় উপযুক্ত ফর্মটি ব্যবহার করুন।
বাটন ব্যবহার করে পছন্দসই নথি নির্বাচন করুন "ফাইল", মূল টেক্সট ভাষা, আউটপুট বিন্যাস উল্লেখ করুন, তারপর ফাইল লোড এবং ক্লিক করার জন্য অপেক্ষা করুন "রূপান্তর করুন". - ডিজিটাইজেশন প্রক্রিয়া শেষে, ক্লিক করুন "আউটপুট ফাইল ডাউনলোড করুন" কম্পিউটারে পাঠ্য সহ শেষ নথি সংরক্ষণ করুন।
অনুমোদিত ব্যবহারকারীদের জন্য, ক্রম ক্রম কিছুটা ভিন্ন।
- বাটন ব্যবহার করুন "নিবন্ধীকরণ" অথবা "লগইন" উপরের মেনু বারে, যথাক্রমে, একটি অ্যাকাউন্ট বিনামূল্যে অনলাইন ওসিআর তৈরি করুন অথবা এতে যান।
- স্বীকৃতি প্যানেল অনুমোদন পরে, কী ধরে রাখা «জন্য CTRL»প্রদত্ত তালিকা থেকে উত্স দস্তাবেজের দুইটি ভাষা নির্বাচন করুন।
- পিডিএফ থেকে টেক্সট আহরণ এবং আরও বাটন ক্লিক করার জন্য আরও অপশন উল্লেখ করুন। "ফাইল নির্বাচন করুন" সেবা মধ্যে নথি লোড।
তারপর, স্বীকৃতি শুরু করতে ক্লিক করুন "রূপান্তর করুন". - নথির প্রক্রিয়াকরণের পর, সংশ্লিষ্ট কলামে আউটপুট ফাইলটির নামের সাথে লিঙ্কটিতে ক্লিক করুন।
স্বীকৃতি ফলাফল অবিলম্বে আপনার কম্পিউটারের স্মৃতিতে সংরক্ষিত হবে।
যদি আপনি একটি ছোট পিডিএফ নথি থেকে পাঠ্যটি বের করতে চান, তবে আপনি উপরে বর্ণিত সরঞ্জামটি ব্যবহার করতে নিরাপদভাবে অবলম্বন করতে পারেন। বড় ফাইলগুলির সাথে কাজ করার জন্য, আপনাকে বিনামূল্যে অনলাইন ওসিআর এ অতিরিক্ত প্রতীক কিনতে হবে অথবা অন্য সমাধানটি উপভোগ করতে হবে।
পদ্ধতি 3: নিউওসিআর
পুরোপুরি ফ্রি ওসিআর-পরিষেবা যা আপনাকে ডিজিভি এবং পিডিএফ এর মতো গ্রাফিক এবং ইলেকট্রনিক নথি থেকে পাঠ্যটি বের করতে দেয়। সম্পদ আকার এবং সংখ্যা সনাক্তকরণযোগ্য ফাইলগুলির উপর বিধিনিষেধ আরোপ করে না, নিবন্ধীকরণের প্রয়োজন নেই এবং সম্পর্কিত ক্রিয়াকলাপগুলির বিস্তৃত অফার দেয়।
নিউওসিআর 106 টি ভাষা সমর্থন করে এবং এমনকি কম-গুণমান নথি স্ক্যান স্ক্যান করতে সক্ষম। ফাইল পৃষ্ঠায় টেক্সট স্বীকৃতির জন্য এলাকাটি ম্যানুয়ালি নির্বাচন করা সম্ভব।
অনলাইন সেবা নিউওসিআর
- সুতরাং, আপনি অপ্রয়োজনীয় কর্ম সঞ্চালনের প্রয়োজন ছাড়া অবিলম্বে সংস্থার সাথে কাজ শুরু করতে পারেন।
সরাসরি প্রধান পৃষ্ঠায় সাইটটিতে দস্তাবেজ আমদানি করার জন্য একটি ফর্ম রয়েছে। নতুন ফাইলটিতে ফাইল আপলোড করার জন্য বোতামটি ব্যবহার করুন "ফাইল নির্বাচন করুন" বিভাগে "আপনার ফাইল নির্বাচন করুন"। তারপর মাঠে "স্বীকৃতি ভাষা (গুলি)" উৎস নথির এক বা একাধিক ভাষা নির্বাচন করুন, তারপরে ক্লিক করুন "আপলোড + ওসিআর". - আপনার পছন্দের স্বীকৃতি সেটিংস সেট করুন, পাঠ্যটি বের করতে পছন্দসই পৃষ্ঠাটি নির্বাচন করুন এবং বোতামে ক্লিক করুন। «OCR করুন».
- একটি বিট নিচে স্ক্রোল এবং বাটন খুঁজে। «ডাউনলোড».
এটির উপর ক্লিক করুন এবং ড্রপ-ডাউন তালিকাটি ডাউনলোড করার জন্য প্রয়োজনীয় নথি ফর্ম্যাট নির্বাচন করুন। তারপরে, উত্তোলিত পাঠ্য সহ সমাপ্ত ফাইলটি আপনার কম্পিউটারে ডাউনলোড হবে।
হাতিয়ার সুবিধাজনক এবং পর্যাপ্ত উচ্চ মানের সব অক্ষর স্বীকৃতি দেয়। যাইহোক, আমদানি করা পিডিএফ নথির প্রতিটি পৃষ্ঠার প্রক্রিয়াকরণ স্বাধীনভাবে চালু করা উচিত এবং পৃথক ফাইলে প্রদর্শিত হবে। আপনি, অবশ্যই, অবিলম্বে ক্লিপবোর্ডে স্বীকৃতি ফলাফল অনুলিপি করতে এবং অন্যদের সাথে মার্জ করতে পারেন।
যাইহোক, উপরে উল্লিখিত, নিউওসিআর ব্যবহার করে প্রচুর পরিমাণে পাঠ্য বের করা খুব কঠিন। একই ছোট ফাইল পরিষেবা সঙ্গে "একটি ঠুং ঠুং শব্দ।"
পদ্ধতি 4: ওসিআর স্পেস
ডিজিটাইজিং পাঠ্যের জন্য একটি সহজ এবং বোধগম্য সম্পদ আপনাকে PDF নথিগুলি সনাক্ত করতে এবং একটি TXT ফাইলের ফলাফলটি আউটপুট করার অনুমতি দেয়। পেজ সংখ্যা কোন সীমা নেই। শুধুমাত্র সীমাবদ্ধতা হল ইনপুট নথির আকার 5 মেগাবাইটের বেশি হওয়া উচিত নয়।
ওসিআর স্পেস অনলাইন সেবা
- টুল দিয়ে কাজ নিবন্ধন প্রয়োজন হয় না।
উপরের লিঙ্কে ক্লিক করুন এবং বাটন ব্যবহার করে আপনার কম্পিউটার থেকে পিডিএফ নথিটি আপলোড করুন "ফাইল নির্বাচন করুন" বা নেটওয়ার্ক থেকে - রেফারেন্স দ্বারা। - ড্রপডাউন তালিকা "ওসিআর ভাষা নির্বাচন করুন" আমদানি নথি ভাষা নির্বাচন করুন।
তারপর বোতামে ক্লিক করে টেক্সট স্বীকৃতি প্রক্রিয়া শুরু করুন। "ওসিআর শুরু করুন!". - ফাইল প্রক্রিয়াকরণ শেষে, ফলাফল দেখুন "OCR এর ফলাফল" এবং ক্লিক করুন «ডাউনলোড»সমাপ্ত TXT নথি ডাউনলোড করতে।
যদি আপনি কেবল পিডিএফ থেকে পাঠ্যটি বের করতে চান এবং চূড়ান্ত বিন্যাসটি গুরুত্বপূর্ণ না হয়, তবে OCR.Space একটি ভাল পছন্দ। একমাত্র ডকুমেন্ট অবশ্যই "একক" হতে হবে, যেহেতু পরিষেবাটিতে একই সময়ে দুই বা ততোধিক ভাষার স্বীকৃতি প্রদান করা হয় না।
আরও দেখুন: ফ্রি উপায়ে FineReader
নিবন্ধটিতে উপস্থাপিত অনলাইন সরঞ্জামগুলি মূল্যায়ন করে, এটি লক্ষ্য করা উচিত যে ABBYY থেকে FineReader অনলাইন ওসিআর ফাংশনটিকে সবচেয়ে সঠিক এবং সঠিকভাবে পরিচালনা করে। পাঠ স্বীকৃতি সর্বাধিক সঠিকতা আপনার জন্য গুরুত্বপূর্ণ হলে, বিশেষ করে এই বিকল্পটি বিবেচনা করা ভাল। কিন্তু এর জন্য অর্থ প্রদান, সম্ভবত, এছাড়াও আছে।
যদি আপনি ছোট নথিগুলিকে ডিজিটাইজ করতে চান এবং আপনি নিজের পরিষেবাটিতে ভুল সংশোধন করতে প্রস্তুত হন তবে এটি নিউওসিআর, ওসিআর স্পেস বা ফ্রি অনলাইন ওসিআর ব্যবহার করার পরামর্শ দেওয়া হয়।