➢
taqdim etilayotgan axborot turi va xarakteri bo‘yicha (yangiliklar, reklama axboroti,
tematik axborot, ma’lumotnoma axboroti), bu amaliy nuqtai nazardan taqdim etilayotgan
axborotni turi va xarakteri bo‘yicha taqsimlashning eng muhim shakli hisoblanadi, chunki oxir-
oqibatda aynan axborot bilan ta’minlanganlik manbani tanlab olishda hal qiluvchi ahamiyatga ega
bo‘ladi. Shu bilan bir paytda aynan shu jihat taqdim etilayotgan axborotlarning bir xil emasligi
sababli eng qiyin ifodalanuvchi bo‘lishi mumkin. Masalan, bitta web-saytning o‘zi turli
ko‘rinishdagi axborotlarga ega bo‘lishi mumkin. Shu sababdan keltirilgan guruhlarga taqsimlash
shartli hisoblanadi.
Axborot izlash vositalari Axborot izlash vositalarini tashkil qilish va foydalanish tamoyili
bo‘yicha quyidagi vositalarni ajratib ko‘rsatish mumkin:
➢
qidiruv mashinalari – axborot izlashning asosiy vositasi hisoblanadi,
chunki Internet
web-serverlarining aksariyati indekslarini qamrab oladi. Biroq aynan shu ustunlik uning
kamchiligi ham bo‘lib chiqadi. Har qanday so‘rovga ular, odatda juda katta hajmda axborot
beradilarki, bu ma’lumotlarning orasida foydalanuvchi uchun kerakli axborot juda kam bo‘ladi;
➢
qidiruv metavositalari – qidiruv argumentlarini, ya’ni tayanch so‘zlarni bir vaqtning
o‘zida bir nechta qidiruv tizimlariga berish yo‘li bilan so‘rovni bajarish jarayonini tezlashtirishga
imkon beradi. Qidiruv qamrovi kengayib, jarayon tezlashgan sharoitda bu usul so‘rov bilan ishlash
natijalari bir nechta tizimdan kelib tushganda ularni vaqt bo‘yicha muvofiqlashtirish zarurati bilan
bog‘liq kamchiliklarga ham ega bo‘ladi;
➢
ixtisoslashgan qidiruv vositalari – «o‘rgimchak-dasturlar» bo‘lib, avtomatik rejimda
web-sahifalarni ko‘rib chiqadi va kerakli axborotni qidirib topadi. Ularning ishlash mexanizmi
qidiruv tizimlari o‘z indeks jadvallarini yaratishda foydalanuvchi mexanizmga yaqin;
➢
kataloglar – qidiruv mashinalari kabi Internetdan foydalanuvchilar
tomonidan zarur
axborotni topish uchun foydalaniladi.
Katalog barcha ma’lumotlar foydalanuvchilar tashabbusi bilan kiritiluvchi iyerarxik tashkil
qilingan tuzilmani ifodalaydi. Natijada ulardagi axborot hajmi qidiruv tizimlariga nisbatan biroz
cheklangan, biroq shu bilan bir paytda ularning asosida yotuvchi iyerarxik mavzu tuzilmasi sababli
ancha tartibga solingan bo‘ladi. Axborot izlash usullari. Har qanday vazifaga jiddiy yondashuv uni
hal qilish mumkin bo‘lgan usullarni tahlil qilishdan boshlanadi.
Internetda axborot izlashni ikkita asosiy usul yordamida amalga oshirish mumkin bo‘lib,
ular maqsad va vazifalardan kelib chiqqan holda birgalikda yoki bir-biridan alohida qo‘llanishi
mumkin:
1. Qidiruv tizimlaridan foydalanish - bugungi kunda ushbu usul ma’lumot izlashning eng
asosiy usullaridan biri hisoblanadi. Uning qo‘llanishi tizimga qidiruv argumenti sifatida beriluvchi
tayanch so‘zlarga asoslanadi. Natijada detalli ko‘rib chiqish talab qilinuvchi Internet resurslari
ro‘yxati olinadi. Eng to‘g‘ri keluvchi natijani olish tezaurus tuzish bo‘yicha oldindan ishlashni
talab qiladi;
2. Gipermatn ssilkalar bo‘yicha izlash – Internetdagi barcha saytlar bir-biri bilan
giperssilkalar orqali bog‘liqligi sababli axborot izlash brauzer yordamida ssilkalar bilan
bog‘langan web-sahifalarni ketma-ketlikda ko‘rib chiqish yo‘li bilan amalga oshirilishi mumkin.
Qidiruvning bu turiga kataloglar, tasnifiy va tematik ro‘yxatlar va turli
ma’lumotnomalardan foydalanishni kiritish mumkin. Bunday usul eng ko‘p mehnat talab qiladi,
biroq websahifalarni «qo‘lbola» ko‘rib chiqish chuqur tahlil talab qiluvchi axborot izlashning
yakuniy bosqichlarida yagona to‘g‘ri usul bo‘lib chiqishi mumkin. Qidiruv mashinalari yordamida
axborot izlash. Eng ko‘p qo‘llanuvchi, lekin shu bilan bir paytda eng murakkab qidiruv usuli
qidiruv tizimlaridan foydalangan holda axborot izlash hisoblanadi.
Uning keng tarqalganligi
qidiruv tizimlari ko‘p sonli saytlar indeksini qamrab olishi va to‘g‘ri ifodalangan so‘rov yordamida
qiziqtirayotgan resurslarga tezda ssilkalar olish mumkinligi bilan asoslanadi. Usulning
murakkabligi shundaki, natija sifatli bo‘lishi uchun eng to‘g‘ri keluvchi qidiruv tizimlarini tanlay
olish, unga so‘rovlarni to‘g‘ri shakllantirish, uning o‘ziga xos xususiyatlari va funksional
imkoniyatlarini hisobga olish zarur. Qidiruv tizimlarini tanlash. Ushbu bosqich qidiruv
mashinalaridan bu mashinalarning har birini qo‘llagan holda kutilayotgan samaradorlikning
pasayib borishiga muvofiq foydalanish ketmaketligini aniqlashni talab qiladi. Qamrab olish
mintaqalari, qidiruv o‘tkazish tamoyillari (demak, so‘rovlar tili va xarakteri bo‘yicha ham), indeks
bazasi hajmi, axborotni yangilash tezligi, «nostandart» axborot izlash qobiliyati bo‘yicha
farqlanuvchi jami bir necha yuzga yaqin qidiruv mashinalari ma’lum.
Qidiruv mashinalarini
tanlashning asosiy mezoni serverning indeks bazasi hajmi va qidiruv mashinasining o‘zi
rivojlanganlik darajasi, ya’ni u qabul qilayotgan so‘rovlarning murakkablik darajasi hisoblanadi.
Qidiruv mashinalariga so‘rovlar tuzish va bajarish Bu katta hajmdagi axborotni qayta ishlash bilan
bog‘liq eng murakkab va mehnat talab qiluvchi bosqichdir. Tezaurus asosida tanlab olingan
qidiruv serverlariga so‘rov shakllantiriladi. Dastlabki natijalar olingandan so‘ng relevant
bo‘lmagan axborotni chiqarib tashlash maqsadida so‘rovni aniqlashtirish mumkin. So‘ngra qidiruv
maqsadlaridan kelib chiqqan holda eng qiziqarli resursdan boshlab resurslarni tanlash amalga
oshiriladi va relevant deb tan olingan resurslar ma’lumotlari tahlil uchun to‘planadi. So‘rovlar
formati ham, semantikasi ham qo‘llanayotgan qidiruv mashinasi va muayyan predmet sohasiga
qarab turli variantda bo‘lishi mumkin. So‘rovlar shunday tuzilishi kerakki, qidiruv sohasi
maksimal darajada aniqlashtirilgan bo‘lishi, ya’ni bitta kengaytirilgan so‘rovdan foydalanish
o‘rniga bir nechta kichik maxsus so‘rovlardan foydalanish maqsadga muvofiq.
Turli mashinalar uchun so‘rov tillari asosan quyidagi funksiyalarning birikuvi hisoblanadi:
➢
hujjatlar qidirishni quyidagi operatorlari yordamida amalga oshirish: AND, OR, NOT, AND –
u birlashtiruvchi barcha atamalar bor bo‘lgan, OR – izlanayotgan matnda operator birlashtirgan
atamalardan hech bo‘lmasa bittasi mavjud bo‘lgan; NOT – matnida
mazkur operator ortidan
keluvchi atamalar yo‘q bo‘lgan hujjatni izlash;
➢
atamalarni kesish imkoniyati – atamaning oxiri o‘rniga belgisidan foydalanish ro‘yxatga
so‘zning boshlang‘ich qismi shablonidan boshlanuvchi barcha so‘zlarni kiritishga imkon beradi;
➢
til morfologiyasini hisobga olish – mashina qidiruv borayotgan tilda mazkur atamaning
barcha shakllarini avtomatik ravishda hisobga oladi;
➢
so‘z birikmasi, ibora bo‘yicha ma’lumot qidirish imkoniyati;
➢
qidiruvni hujjat elementi bilan cheklash (so‘rov so‘zlari aynan sarlavhada, birinchi
abzatsda, ssilkada joylashishi mumkin va hokazo);
➢
hujjat chiqarilgan sana bo‘yicha cheklash;
➢
atamalarning mos tushishi soni bo‘yicha cheklash;
➢
grafik tasvirlarni izlash imkoniyati;
➢
kichik va bosh xarflarga qarab izlash. So‘rov
natijasi, ya’ni tizim chiqarib bergan
topilgan resurslarga ssilkalar ro‘yxati ikki bosqichda qayta ishlanadi.
Dastlabki bosqichda ro‘yxat tarkibiga qidiruv mashinasining mukammal emasligi yoki
so‘rovning yetarli darajada «intellektual» emasligi sababli kirib qolgan norelevant manbalar
chiqarib tashlanadi. Parallel ravishda keyingi so‘rovlarni modifikatsiyalash uchun tezaurusni
aniqlashtirish maqsadida semantik tahlil o‘tkaziladi. Keyingi ishlar topilgan har bir resurs bilan
ketma-ketlikda ishlash va undagi axborotni tahlil qilish yo‘li bilan amalga oshiriladi. Resurslar
tahlili va axborot to‘plash Axborot izlashning yakuniy bosqichi resurslar tahlili va axborot to‘plash
hisoblanadi. Resurslarning birlamchi tahlili agar bor bo‘lsa annotatsiyalarga, yo‘q bo‘lsa
resursning axborot mazmuniga asoslanishi lozim. Shundan keyin axborot tanlab olingan
manbalardan chiqarib olinadi va mos keluvchi maqsadlarda foydalaniladi.