فناوری OCR در واقع پل ارتباطی بین انسان و کامپیوتر ها است و زبان مشترک آن ها محسوب می شود. در کل فناوری های مختلفی برای کمک به کامپیوتر ها جهت درک داده ها و زبان انسانی وجود دارد که هر یک می توانند برای بهبود کیفیت ارتباطی بین انسان و کامپیوتر کارایی داشته باشند و او سی آر تنها یکی از آن ها است. این فناوری شاید برای همه شناخته شده نباشد، اما کاربران زیادی از آن استفاده می کنند. برای درک کارایی فناوری OCR، کارشناسان ما در نمایندگی تعمیر دستگاه کپی به صورت مفصل به تعریف این فناوری می پردازند.
فناوری او سی آر چیست؟
این فناوری در واقع یک نرم افزار است. این نرم افزار هوشمند که از فناوری تشخیص کاراکتر نوری یا اپتیکی بهره می برد، می تواند به صورت اتوماتیک داده های متنی و نوشته های مختلف را تجزیه و تحلیل کرده و آن ها را به صورت یک داده دیجیتالی در آورد. به این ترتیب متن مورد نظر برای کامپیوتر ها قابل درک می شود. در واقع این فناوری تشخیص کاراکتر نوری که عملکرد پیچیده ای هم دارد، وظیفه تبدیل کردن کاراکتر های چاپی به کاراکتر های دیجیتالی را به عهده دارد تا به این ترتیب این کاراکتر های معمولی به راحتی توسط کامپیوتر پردازش شوند. فناوری OCR در حال حاضر در سیستم های مختلفی به کار می رود و یکی از مهم ترین ابزار های مورد استفاده در دنیای فناوری است.
فناوری OCR مشابه عملکرد چشم ها و مغز انسان است
برای درک بیشتر این فناوری، باید آن را مشابه عملکرد مغز در نظر بگیریم. در واقع الگوی عملکرد این فناوری در کامپیوتر ها درست مانند عملکردی است که چشم ها و مغز انسان در خواندن و درک متون دارد. برای این که یک متن فهمیده شود، چشم ها با تشخیص کاراکتر ها و حروف مختلف، آن ها را مشاهده، تشخیص و شناسایی می کنند. در ادامه نیز مغز این داده های نوری و تصویری را دریافت کرده و با تجزیه و تحلیل آن، داده ها را قابل درک و فهم می کند. عملکرد فناوری OCR در کامپیوتر ها هم دقیقا مانند همین پروسه در انسان ها عمل می کند و با دریافت داده های تصویری و نوری از یک متن و نوشته متنی، آن ها را به صورت داده های دیجیتالی برگردانده و می خوانند. این عمل البته در کامپیوتر ها کمی پیچیده تر است و به ابزار های بیشتری نیاز دارد.
نحوه عملکرد فناوری OCR در سیستم های کامپیوتری مختلف
تا اینجا هم با او سی آر و هم الگوی کارکرد آن آشنا شدیم. اما برای این که بخواهیم نحوه عملکرد آن را بیشتر درک کنیم، باید دید کامپیوتر ها چطور با این فناوری کار می کنند. بخش اول عملکرد OCR مربوط به خواندن متن است. در کامپیوتر ها، اسکنر ها، دوربین های دیجیتالی یا ابزار هایی مشابه کار چشم ها را انجام می دهند و یک تصویر دیجیتالی از آن متن را در اختیار کامپیوتر قرار می دهند. این عکس درست مانند سایر فایل های گرافیکی دیگر است و در یک سیستم عادی و فاقد فناوری OCR کامپیوتر قادر به تمیز دادن عکس متن از عکس یک منظره یا تصویر دیگری نیست. حال OCR در این مرحله وارد می شود و با قابلیت هایی که دارد این متن را برای کامپیوتر قابل خواندن کرده تا سیستم بتواند متن را تجزیه و تحلیل کرده و بخواند. در ادامه با تبدیل کردن این تصویر متن به یک فرمت قابل خوانش برای کامپیوتر ها مانند فایل TXT یا DOC ، این متن چاپی برای کامپیوتر مورد نظر قابل خواندن خواهد شد.
اساس عملکرد جهانی OCR
این زبان کامپیوتری برای سیستم های مختلف جهان عملکرد مشترکی دارد. این موضوع در نگاه اول بسیار سخت و پیچیده است. در واقعیت هم تمیز دادن و تشخیص زبان های مختلف، متن های مختلف و از همه مهم تر تشخیص دست خط های متفاوت کار بسیار پیچیده ای است. اما اساس ساخت و عملکرد فناوری او سی آر به گونه ای است که نرم افزار را قادر می کند به عنوان زبان مشترک کامپیوتری دنیا عمل کند. برای این منظور فناوری OCR از الگو ها و قوانین مختلفی کمک می گیرد. یکی از این ها شناسایی الگو ها است. علاوه بر این سیستم OCR قادر است حروف و کاراکتر های مخلف را بر اساس مشخصه هایی که دارند، مانند زاویه ها و خطوط کاراکتر ها شناسایی کرده و تشخیص دهد. در نتیجه در حال حاضر شاهد وجود برنامه های مختلف مبتنی بر OCR در دنیای فناوری هستیم که از طیف بسیار گسترده ای از فونت ها و کاراکتر ها پشتیبانی می کنند. در بیشتر این برنامه ها به جای شنایی الگو از شناسایی حروف بر اساس مشخصات شان استفاده می شود.
فناوری OCR قادر به تشخیص الگو های مختلف دست خط است
قابلیت پیچیده تر و جذاب تری که سیستم ها و برنامه های مبتنی بر OCR دارند، در تشخیص الگو های مختلف دست خط است که به نسبت الگو های متنی چاپ شده پیچیدگی های بسیار بیشتری دارد. در این جا هم ابتدا بهتر است او سی آر را با مغز انسان مقایسه کنیم. مغز انسان به راحتی قادر است حتی بد خط ترین دست نوشته ها را هم بخواند و تحلیل کند. در خصوص کامپیوتر ها این کمی پیچیده تر خواهد بود. برای این منظور سیستم های OCR قوانین خاصی را دنبال می کنند. در قدم اول ساده سازی مطرح می شود. به این ترتیب که داده های آسان تر و قابل درک تر تنها توسط نرم افزار خوانده می شوند. مثال این مورد در خصوص مرسوله های پستی است. برای مثال در این مرسوله ها تنها کاراکتر های کد پستی خوانده می شود و کل آدرس توسط سیستم خوانده نخواهد شد. از طرفی نیز واضح نوشتن و جدا کردن حروف مورد مهم دیگری است که در الگوی تشخیص دست خط توسط فناوری OCR باید رعایت شود. برای مثال در فرم هایی که دستی پر می شوند، نام و نام خانوادگی باید به صورت حروف جدا از هم نوشته شوند.
محصولات و تجهیزات مختلفی که از OCR بهره می برند
کامپیوتر های شخصی و انواع PC تنها بخش محدودی از تجهیزاتی هستند که از فناوری او سی آر بهره می برند. در حال حاضر تجهیزات مختلفی در دنیای فناوری با استفاده از OCR استفاده می کنند. برای مثال می توان به یک سری برنامه و نرم افزار تحلیل دست خط اشاره کرد که در سیستم های مختلف کارایی دارند. در بسیاری از این برنامه ها OCR بخش اصلی کار را انجام می دهد. علاوه بر این در بسیاری از اسمارت فون ها می توان ردپای فناوری OCR را مشاهده کرد. جای دیگری که از این فناوری استفاده می شود در شرکت های پستی است. در این مکان ها برای دسته بندی مرسولات پستی مختلف از OCR و قابلیت های آن استفاده می شود. در نهایت در مقیاس های بزرگ تر و در دستگاه های بزرگ برای مدیریت بسته های پستی این فناوری کاربرد دارد.
نحوه اسکن متن با OCR
نکته مهم دیگری مراحل تبدیل متن اسکن شده به یک متن دیجیتال است. در این خصوص برای استفاده از فناوری OCR در یک سیستم مبتنی بر این فناوری باید مراحل زیر دنبال شود:
- ابتدا متن چاپی آماده می شود. این متن باید کیفیت بالایی داشته باشد تا بهترین خروجی OCR به دست بیاید. لکه، جوهر، کثیفی و چروک کاغذ می تواند روی عملکرد او سی آر تاثیر منفی بگذارد
- در مرحله بعد باید متن مورد نظر توسط یک دستگاه اسکنر یا دوربین دیجیتالی اسکن شده و به یک فایل دیجیتالی یا گرافیکی تبدیل شود
- در قدم بعدی فناوری OCR این فایل دیجیتالی را سیاه و سفید می کند. در این مرحله به جز رنگ سفید به عنوان پس زمینه و رنگ سیاه به عنوان کاراکتر ها و حروف، هیچ رنگ دیگری در فایل دیده نمی شود
- قدم بعدی اجرای پروسه OCR روی فایل دیجیتالی مورد نظر است تا این تصویر به یک متن دیجیتالی تبدیل شود
- در بخش های بعدی یک غلط یابی کلی برای متن اجرا شده تا اشکالات احتمالی اصلاح و برطرف شوند. غلط های املایی و مواردی از این دست در این مرحله برطرف می شوند
انواع پیشرفته برنامه های OCR کارایی تحلیل الگو را هم دارند
نکته مهم دیگری که باید به آن اشاره کنیم در مورد آن دسته از برنامه های پیشرفته تر و به روز تری است که از ابزار های قدرت مندی تری در تشخیص الگو ها بهره مندند. در برخی برنامه های پیشرفته تر مبتنی بر OCR، سیستم قادر به تشخیص الگو های غیر متنی هم هست. در این حالت سیستم می تواند المان های دیگر موجود در متن مانند عکس و جدول و نمودار را هم تشخیص داده و آن ها را در خروجی نهایی کار وارد کند. این ابزار تحلیلی الگوی پیشرفته در بسیاری از زمینه ها کارایی بسیار بیشتری را به کاربران ارائه می دهد.
فناوری او سی آر مزیت های زیادی دارد
با آشنا شدن با فناوری OCR و نحوه عملکرد و قابلیت های آن، قطعا درک مزیت هایی که این فناوری به همراه خود دارد کار دشواری نیست. وجود این فناوری در سیستم های کامپیوتری در درجه اول سرعت کار را افزایش می دهد. از طرفی کار ویرایش، انتقال داده متنی، جا به جایی و انتشار متن در وب سایت ها را راحت می کند. کاربران به راحتی می توانند یک متن را بررسی کرده، کلمات را با سرعت بالا در میانه متن جست و جو کنند، در زمانی سریع تر و راحت متن را ویرایش کنند و در صورت نیاز آن را در سرویس های ابری ذخیره کرده یا در فضای مجازی منتشر کنند. اما شاید مهم ترین مزیت فناوری او سی آر برای افراد نابینا باشد. چرا که با تبدیل کردن یک متن مانند یک کتاب به یک فایل دیجیتالی، می توان سریع و راحت این فایل دیجیتالی را به یک فایل صوتی تبدیل کرد. به این ترتیب کاربران نابینا با تکیه به فناوری OCR می توانند به راحتی متون و کتاب های چاپی را به صورت فایل صوتی بخوانند.