OCR

نويسه خوان نوري (Optical Character Recognition)که با سرواژه (OCR) شناخته می‌شود، عبارت است از تشخیص خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، بایستی به نحوی نوشته‌های موجود در سند را تشخیص دهیم. چنین کاری توسط نرم ‌افزارهای نویسه خوان نوری انجام می‌شود. معمولاً اسکنر، تصاویر مورد نیاز برای تشخیص نویسه را فراهم می‌آورند. بنابراين براي استفاده از نويسه خوان نوري لازم است كه كليه اسناد و مدارك مورد نظر توسط اسكنر به فايل تصويري تبديل شوند. سامانه نویسه خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آنها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانه نویسه خوان بسیار کم حجم و قابل جستجو است. سامانه‌های نویسه خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو مبحث اصلی در این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن نویسه خوانی نوری برای زبانهای لاتین به دلیل اینکه حروف آنها به‌طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوه جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه خوان زبان فارسی نقاط ضعف زیادی داشته باشند. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمينه پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده‌است.

خدمات تخصصي ساماندهي فيزيكي خدمات تخصصي ساماندهي فيزيكي خدمات تخصصي ساماندهي فيزيكي خدمات تخصصي ساماندهي فيزيكي

خدمات تخصصي اسكن اسناد و مدارك خدمات تخصصي اسكن اسناد و مدارك خدمات تخصصي اسكن اسناد و مدارك خدمات تخصصي اسكن اسناد و مدارك

خدمات تخصصي ساماندهي الكترونيكي خدمات تخصصي ساماندهي الكترونيكي خدمات تخصصي ساماندهي الكترونيكي خدمات تخصصي ساماندهي الكترونيكي

کلیه حقوق مادی و معنوی این سایت متعلق به ” شرکت پردازش اطلاعات وايا ” ميباشد.