|
O'zbekiston respublikasi raqamli texnologiyalar vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti
|
bet | 2/15 | Sana | 20.05.2024 | Hajmi | 1,32 Mb. | | #246844 |
Bog'liq SHAXZOD (induvidual loyiha 2)NAZARIY QISM
Optik belgilarni aniqlash (OCR) haqida tushuncha
Optik belgilarni aniqlash (OCR) ba'zan matnni aniqlash deb ataladi. OCR dasturi skanerlangan hujjatlar, kamera tasvirlari va faqat tasvirli pdf-fayllardan ma'lumotlarni ajratib oladi va qayta ishlatadi. OCR dasturi tasvirdagi harflarni ajratib ko'rsatadi, ularni so'zlarga qo'yadi va keyin so'zlarni jumlalarga qo'yadi, shu bilan asl tarkibga kirish va tahrirlash imkonini beradi. Bundan tashqari, ma'lumotlarni qo'lda kiritish zaruriyatini yo'q qiladi.
OCR tizimlari jismoniy, bosma hujjatlarni mashinada o'qiladigan matnga aylantirish uchun apparat va dasturiy ta'minot kombinatsiyasidan foydalanadi. Uskuna - optik skaner yoki maxsus elektron plata kabi - matnni nusxalaydi yoki o'qiydi; keyin, dasturiy ta'minot odatda rivojlangan ishlov berish bilan shug'ullanadi.
OCR dasturiy ta'minoti sun'iy intellekt (AI) dan tillarni yoki qo'l yozuvi uslublarini aniqlash kabi aqlli belgilarni aniqlashning (ICR) yanada ilg'or usullarini amalga oshirish uchun foydalanishi mumkin. OCR jarayoni ko'pincha yuridik yoki tarixiy hujjatlarni PDF hujjatlariga aylantirish uchun ishlatiladi, shunda foydalanuvchilar hujjatlarni matn protsessorida yaratilgandek tahrir qilishlari, formatlashlari va qidirishlari mumkin.
Optik belgilarni aniqlash tarixi
1974 yilda Rey Kurzveyl Kurzweil Computer Products, Inc. kompaniyasini ishga tushirdi, uning omni-shriftli optik belgilarni aniqlash (OCR) mahsuloti deyarli har qanday shriftda chop etilgan matnni taniy oladi. U ushbu texnologiyaning eng yaxshi qo‘llanilishi ko‘zi ojizlar uchun mashinada o‘qitish qurilmasi bo‘lishiga qaror qildi, shuning uchun u matnni matndan nutqqa formatida ovoz chiqarib o‘qiy oladigan o‘qish mashinasini yaratdi. 1980 yilda Kurzveyl o'z kompaniyasini qog'ozdan kompyuterga matn konvertatsiyasini tijoratlashtirishdan manfaatdor bo'lgan Xerox kompaniyasiga sotdi.
OCR texnologiyasi 1990-yillarning boshlarida tarixiy gazetalarni raqamlashtirish paytida mashhur bo'ldi. O'shandan beri texnologiya bir nechta yaxshilanishlarga duch keldi. Bugungi yechimlar deyarli mukammal OCR aniqligini ta'minlash qobiliyatiga ega. Murakkab hujjatlarni qayta ishlash jarayonlarini avtomatlashtirish uchun ilg'or usullar qo'llaniladi. OCR texnologiyasi mavjud bo'lgunga qadar, hujjatlarni raqamli formatlashning yagona varianti matnni qo'lda qayta yozish edi. Bu nafaqat ko'p vaqt talab qildi, balki muqarrar noaniqliklar va matn terish xatolari bilan ham keldi. Bugungi kunda OCR xizmatlari keng omma uchun mavjud. Masalan, Google Cloud Vision OCR smartfoningizda hujjatlarni skanerlash va saqlash uchun ishlatiladi.
|
|
Bosh sahifa
Aloqalar
Bosh sahifa
O'zbekiston respublikasi raqamli texnologiyalar vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti
|