OCR

نويسه خوان نوری (Optical Character Recognition)که با سر واژه (OCR) شناخته می‌شود، عبارت است از تشخیص خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، بایستی به نحوی نوشته‌های موجود در سند را تشخیص دهیم. چنین کاری توسط نرم ‌افزارهای نویسه خوان نوری انجام می‌شود. معمولاً اسکنر، تصاویر مورد نیاز برای تشخیص نویسه را فراهم می‌آورند. بنابراين براي استفاده از نويسه خوان نوری لازم است كه كليه اسناد و مدارك مورد نظر توسط اسكنر به فايل تصويري تبديل شوند. سامانه نویسه خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آنها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانه نویسه خوان بسیار کم حجم و قابل جستجو است. سامانه‌های نویسه خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو مبحث اصلی در این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن نویسه خوانی نوری برای زبانهای لاتین به دلیل اینکه حروف آنها به‌طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوه جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه خوان زبان فارسی نقاط ضعف زیادی داشته باشند. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمينه پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده‌ است.

تاریخچه ocr :
1870: “چارلز آر.کری” مخترع آمریکایی اسکنر شبکیه را اختراع کرد؛ اسکنری با سیستم انتقال تصویر با استفاده از سلول های نوری که اولین اختراع ocr  در جهان محسوب می گردد.

1885: “پائول گوتلیب نیپکو” دیسک نیپکو را اختراع کرد؛ دستگاه اسکنری که بعدها تبدیل به موفقیتی بزرگ برای ارتقاء تلویزیون های مدرن و دستگاه های مطالعه مخصوص نابینان شد.

1900: دانشمند روس “تیورین” اولین ماشین ocr که به نابینایان کمک کند را تصور می کرد؛ اما هرگز موفق به تولید آن نشد.

1912: “ادموند فورنیر دی آلبه” Optophone را اختراع کرد؛ اسکنری دستی که وقتی روی یک کاغذ چاپ شده حرکت داده می شد در مواجهه با حروف و کاراکترهای خاص صداهایی را تولید می کرد، به طوری که توسط نابینایان قابل تفسیر بود.

1916: مهندس آمریکایی “جان بی فلاورز” «دستگاه تک چشم استنوگرافر» را اختراع کرد؛ دستگاهی با قابلیت خواندن و تایپ کردن متن. اساس کار دستگاه بر بارگذاری تمام حروف برای یافتن نقطه ای که برای هرکدام جداگانه علامت گذاری شده بود میسر گشت.

1921: “سیرو کودلوپی” پروفسور ایتالیایی «ماشین خواندن برای نابینایان» را طراحی کرد؛ ماشینی با قابلیت تبدیل حس بینایی به حس لامسه 

1929: “گوستاو تاوشک” مهندس اتریشی اولین دستگاه ocr را با نام «دستگاه خواندن» تولید کرد؛ به وسیله سنسور نقطه ای نور بر روی کلمات و تطابق با محتوای حافظه دستگاه

1938: “ونوار بوش” استاد دانشگاه MIT دستگاه «انتخاب کننده سریع میکروفیلم» رو اختراع کرد؛ دستگاهی شبیه ولی ساده تر از دستگاه “گلدبرگ” با سرعت 40 برابر بیشتر

1949: مهندسان شاغل در «شرکت رادیویی آمریکا» پروژه ای را تحت عنوان اولین تکنیک های تبدیل متن به گفتار، برای کمک به نابینایان و سازمان نیروهای مسلح ایالت متحده آغاز کردند.

1951: “دیوید اچ شپرد” و “هاروی کوک جونیور” تحلیلگران رمزنگار آمریکایی «جیسمو» را ساختند؛ دستگاهی که می توانست نامه را حرف به حرف بخواند و کد مورس را تفسیر کند.

1952: شرکت تحقیقاتی ماشین هوشمند توسط “دی شپرد” و “ویلیام لالس جونیور” برای تجارت «جیسمو» که بعداً به “خواننده تحلیل گر” تغییر نام یافت، تأسیس شد.

1954: مجله امریکایی “ریدر دایجست” تبدیل به اولین مصرف کننده تجاری ocr reader شد؛ که این دستگاه را برای تبدیل گزارشات فروش تایپ شده به کارت های پانچ شده مورد استفاده قرار می داد.

1962: “جان لینویل” استاد دانشگاه استنفورد، «اپتاکن» را توسعه داد؛ «اپتاکن» اولین دستگاه خواندن قابل حمل برای نابینایان بود.

1965: “ریدر دایجست” به وسیله کامپیوتر RCA501 استفاده از ocr خود را برای دیجیتالی کردن شماره سریال کوپن ها گسترش داد.

1965: “جیکوب رابینو” مخترع آمریکایی یک ماشین ocr برای مرتب سازی نامه های اداره پست ایالات متحده تولید کرد.

1966: آزمایشگاه “آی بی ام روچستر” دستگاه “IBM 1287” را توسعه داد، اولین اسکنری که قادر به خواندن هر شماره دست نویس بود.

1966: به “لینویل” حق ثبت اختراع “Optacon” اعطا شد؛ که تحت عنوان “کمک کننده ی خواندن نابینایان” ثبت گردید. (ثبت اختراع ایالات متحده -3229387)

1968: بنیانگذاران تایپ آمریکایی و طراح سوئیسی “آدریان فروتیگر” OCR-A و OCR-B را معرفی کردند؛ حروف چاپی ساخته شده برای تسهیل عملیات OCR

1971: اپراتورهای اداره پست کانادا شروع به استفاده از سیستم های ocr  برای خواندن نام و آدرس روی پاکت نامه ها و چاپ بارکد با استفاده از جوهر فرابنفش کردند. (ثبت اختراع ایالات متحده به شماره 5420403)

{در حال تکمیل}

خدمات تخصصی ساماندهی فيزيكی خدمات تخصصی ساماندهی فيزيكی خدمات تخصصی ساماندهی فيزيكی خدمات تخصصی ساماندهی فيزيكی

خدمات تخصصی اسكن اسناد و مدارك خدمات تخصصی اسكن اسناد و مدارك خدمات تخصصی اسكن اسناد و مدارك خدمات تخصصی اسكن اسناد و مدارك

خدمات تخصصی ساماندهی الكترونيكی خدمات تخصصی ساماندهی الكترونيكی خدمات تخصصی ساماندهی الكترونيكی خدمات تخصصی ساماندهی الكترونيكی

کلیه حقوق مادی و معنوی این سایت متعلق به ” شرکت پردازش اطلاعات وايا ” ميباشد.