টেক্সট স্বীকৃতি। ফ্রি প্রোগ্রাম - এনালগ FineReader

শীঘ্রই বা পরে, যারা অফিস অফিসগুলির সাথে প্রায়শই কাজ করে তারা সাধারণত একটি সাধারণ কাজ করে - একটি বই, পত্রিকা, সংবাদপত্র, সহজলভ্য লিফলেট থেকে পাঠ্য স্ক্যান করে এবং তারপর এই ছবিগুলিকে পাঠ্য বিন্যাসে অনুবাদ করে, উদাহরণস্বরূপ, একটি শব্দ নথিতে।

এটি করার জন্য আপনাকে পাঠ্য স্বীকৃতির জন্য একটি স্ক্যানার এবং একটি বিশেষ প্রোগ্রাম প্রয়োজন। এই নিবন্ধ FineReader বিনামূল্যে analogue আলোচনা হবে -কীলকাকার (FineReader এ স্বীকৃতি সম্পর্কে - এই নিবন্ধটি দেখুন)।

আসুন শুরু করি ...

কন্টেন্ট

  • 1. CuneiForm প্রোগ্রাম বৈশিষ্ট্য, বৈশিষ্ট্য
  • 2. টেক্সট স্বীকৃতি একটি উদাহরণ
  • 3. ব্যাচ টেক্সট স্বীকৃতি
  • 4. উপসংহার

1. CuneiForm প্রোগ্রাম বৈশিষ্ট্য, বৈশিষ্ট্য

কীলকাকার

আপনি বিকাশকারীর সাইট থেকে ডাউনলোড করতে পারেন: //cognitiveforms.com/

একটি ওপেন সোর্স টেক্সট স্বীকৃতি সফ্টওয়্যার। উপরন্তু, এটা উইন্ডোজ এর সব সংস্করণে কাজ করে: এক্সপি, ভিস্তা, 7, 8, যা pleases। প্লাস, প্রোগ্রামের সম্পূর্ণ রাশিয়ান অনুবাদ যুক্ত করুন!

পেশাদাররা:

- পৃথিবীর ২0 টি জনপ্রিয় ভাষাগুলিতে পাঠ্য স্বীকৃতি (ইংরেজি এবং রাশিয়ান নিজেই এই সংখ্যাটিতে অন্তর্ভুক্ত);

- বিভিন্ন মুদ্রণ ফন্ট জন্য বিশাল সমর্থন;

- অভিধান স্বীকৃত টেক্সট চেক করুন;

- বিভিন্ন উপায়ে কাজ ফলাফল সংরক্ষণ করার ক্ষমতা;

- নথি গঠন বজায় রাখা;

- চমৎকার সমর্থন এবং স্বীকৃতি টেবিল।

কনস:

- খুব বড় নথি এবং ফাইল সমর্থন করে না (400 ডিপিআই থেকেও বেশি);

- কিছু ধরণের স্ক্যানারকে সরাসরি সমর্থন করে না (ভাল, এটি ভীতিকর নয়, স্ক্যানার ড্রাইভারগুলির সাথে একটি বিশেষ স্ক্যানার অন্তর্ভুক্ত);

- নকশাটি উজ্জ্বল হয় না (তবে প্রোগ্রামটি সম্পূর্ণরূপে সমস্যার সমাধান করলে এটির প্রয়োজন হয়)।

2. টেক্সট স্বীকৃতি একটি উদাহরণ

আমরা অনুমান করি যে আপনি ইতিমধ্যে স্বীকৃতির জন্য প্রয়োজনীয় ছবিগুলি পেয়েছেন (সেখানে স্ক্যান করা আছে, অথবা ইন্টারনেটে পিডিএফ / ডিজেভিউ ফরম্যাটে বইটি ডাউনলোড করেছেন এবং তাদের কাছ থেকে প্রয়োজনীয় ছবিগুলি পেয়েছেন। এটি কিভাবে করবেন - এই নিবন্ধটি দেখুন)।

1) কুইনফর্ম প্রোগ্রামে প্রয়োজনীয় চিত্রটি খুলুন (ফাইল / খুলুন অথবা "Cntrl + O")।

2) স্বীকৃতি শুরু করার জন্য - আপনাকে অবশ্যই প্রথমে বিভিন্ন এলাকা নির্বাচন করতে হবে: পাঠ্য, ছবি, টেবিল ইত্যাদি। Cuneiform প্রোগ্রামে, এটি কেবল নিজেও করা যাবে না, তবে এটিও স্বয়ংক্রিয়ভাবে! এটি করার জন্য, উইন্ডোটির উপরের অংশে "মার্কআপ" বোতামটিতে ক্লিক করুন।

3) 10-15 সেকেন্ড পরে। প্রোগ্রাম স্বয়ংক্রিয়ভাবে বিভিন্ন রং সঙ্গে সব এলাকায় হাইলাইট হবে। উদাহরণস্বরূপ, একটি টেক্সট এলাকা নীল হাইলাইট করা হয়। উপায় দ্বারা, তিনি সঠিকভাবে এবং বরং দ্রুত সব এলাকায় হাইলাইট। সত্যি, আমি তার কাছ থেকে এত দ্রুত এবং সঠিক প্রতিক্রিয়া আশা করিনি ...

4) যারা স্বয়ংক্রিয় মার্কআপকে বিশ্বাস করে না তাদের জন্য আপনি ম্যানুয়ালটি ব্যবহার করতে পারেন। এর জন্য একটি টুলবার রয়েছে (নীচের ছবিটি দেখুন), ধন্যবাদ যা আপনি নির্বাচন করতে পারেন: পাঠ্য, টেবিল, ছবি। সরানো, প্রাথমিক ইমেজ বৃদ্ধি / হ্রাস, প্রান্ত ছাঁটাই। সাধারণভাবে, একটি ভাল সেট।

5) সব এলাকায় চিহ্নিত করা হয়েছে, আপনি এগিয়ে যেতে পারেন স্বীকার। এটি করার জন্য, নীচের চিত্রটিতে, একই নামের বোতামটি ক্লিক করুন।

6) আক্ষরিক 10-20 সেকেন্ডের মধ্যে। আপনি স্বীকৃত পাঠ্য সহ মাইক্রোসফ্ট ওয়ার্ডে একটি দস্তাবেজ দেখতে পাবেন। এই উদাহরণের জন্য পাঠ্যটিতে আকর্ষণীয় কি, অবশ্যই ভুল ছিল, কিন্তু তাদের মধ্যে খুব কমই আছে! বিশেষত, মূল উপাদান কিভাবে প্লেইন ছিল বিবেচনা - ছবি।

গতি এবং মানের FineReader সঙ্গে তুলনীয় তুলনীয়!

3. ব্যাচ টেক্সট স্বীকৃতি

প্রোগ্রামটির এই ফাংশনটি যখন আপনি এক ছবি চিনতে না চান তখন সহজেই আসতে পারে তবে একাধিকবার। ব্যাচ স্বীকৃতি আরম্ভ করার জন্য শর্টকাট সাধারণত শুরু মেনুতে লুকানো থাকে।

1) প্রোগ্রামটি খোলার পরে, আপনাকে একটি নতুন প্যাকেজ তৈরি করতে হবে, বা পূর্বে সংরক্ষিত একটি খুলতে হবে। আমাদের উদাহরণ - একটি নতুন তৈরি করুন।

2) পরবর্তী ধাপে আমরা এটি একটি নাম দিই, বিশেষতঃ এমন যে ছয় মাস পরে আমরা এটি সংরক্ষণ করব তা মনে রাখবেন।

3) পরবর্তীতে, নথি ভাষাটি নির্বাচন করুন (রাশিয়ান-ইংরাজী), আপনার স্ক্যান করা উপাদানগুলিতে ছবি এবং সারণী আছে কিনা তা ইঙ্গিত করে।

4) এখন আপনাকে এমন ফোল্ডার নির্দিষ্ট করতে হবে যেখানে স্বীকৃতির জন্য ফাইলগুলি অবস্থিত। যাইহোক, মজার বিষয় হল প্রোগ্রামটি নিজেই সমস্ত ছবি এবং অন্যান্য গ্রাফিক ফাইল খুঁজে পাবে যা এটি চিনতে পারে এবং প্রকল্পে যুক্ত করে। আপনি অতিরিক্ত অপসারণ করতে হবে।

5) পরবর্তী পদক্ষেপটি গুরুত্বপূর্ণ নয় - স্বীকৃতির পরে উৎস ফাইলগুলির সাথে কী করবেন তা চয়ন করুন। আমি চেকবক্স "কিছুই না" নির্বাচন করার সুপারিশ।

6) এটি স্বতন্ত্র ডকুমেন্ট সংরক্ষণ করা হবে, যা ফর্ম্যাট নির্বাচন শুধুমাত্র রয়ে যায়। বিভিন্ন অপশন আছে:

- RTF - শব্দ নথির ফাইলটি সমস্ত জনপ্রিয় অফিসগুলি (বিনামূল্যেগুলি সহ, প্রোগ্রামগুলির একটি লিঙ্ক) দ্বারা খোলা হয়;

- পাঠ্য - টেক্সট বিন্যাস, আপনি শুধুমাত্র টেক্সট, ছবি এবং টেবিল সংরক্ষণ করতে পারেন;

- পেজটি - হাইপারটেক্সট পৃষ্ঠা, যদি আপনি সাইটটির জন্য ফাইলগুলি স্ক্যান এবং সনাক্ত করেন তবে সুবিধাজনক। তাঁর এবং আমাদের উদাহরণ চয়ন করুন।

7) "শেষ" বোতামে ক্লিক করার পরে, আপনার প্রকল্পের প্রক্রিয়া শুরু হবে।

8) প্রোগ্রাম বেশ দ্রুত কাজ করে। স্বীকৃতি দেওয়ার পরে, আপনি এইচটিএমএল ফাইলগুলির সাথে একটি ট্যাব দেখতে পাবেন। আপনি যদি এই ধরনের ফাইলটিতে ক্লিক করেন তবে ব্রাউজার শুরু হয় যেখানে আপনি ফলাফল দেখতে পারেন। যাইহোক, প্যাকেজ এর সাথে আরও কাজ করার জন্য সংরক্ষণ করা যেতে পারে।

9) আপনি দেখতে পারেন ফলাফল কাজ খুব চিত্তাকর্ষক। প্রোগ্রাম সহজেই ছবি স্বীকৃত, এবং সহজে এটি অধীন টেক্সট স্বীকৃত। যদিও প্রোগ্রামটি বিনামূল্যে, এটি সাধারণত সুপার!

4. উপসংহার

আপনি প্রায়ই স্ক্যান এবং ডকুমেন্ট চিনতে না হলে, FineReader কেনার অর্থ সম্ভবত না। CuneiForm সহজে বেশিরভাগ কাজ পরিচালনা করে।

অন্য দিকে, তিনি অসুবিধা আছে।

প্রথমত, ফলাফলের সম্পাদনা এবং পরীক্ষা করার জন্য খুব অল্প সরঞ্জাম রয়েছে। দ্বিতীয়ত, যখন আপনি অনেকগুলি ছবি চিনতে হবে, তখন FineReader- এ ডানদিকের কলামে প্রকল্পটিতে যোগ করা সবকিছু অবিলম্বে দেখতে আরও সুবিধাজনক: দ্রুত অপ্রয়োজনীয় অপসারণ, সম্পাদনাগুলি ইত্যাদি। তৃতীয়ত, একেবারে খারাপ মানের নথিগুলিতে, CuneiForm স্বীকৃতি হারায়: আপনাকে নথিতে মনে রাখতে হবে - সঠিক ভুল, বিরাম চিহ্ন, কোট ইত্যাদি।

যে সব। আপনি অন্য কোন শালীন বিনামূল্যে টেক্সট স্বীকৃতি সফটওয়্যার জানেন?