Korpus lingvistikasi book · October 022 citation reads 1,207 author

Download 4,46 Mb. Pdf ko'rish
bet	66/76
Sana	31.05.2024
Hajmi	4,46 Mb.
	#258257

1 ... 62 63 64 65 66 67 68 69 ... 76

Bog'liq
AbjalovaM.KorpLing.Uslubiyqollanma (1)

Manzura Abjalova

~ 84 ~
TOPSHIRIQLAR JAVOBLARI

1-topshiriq

2-topshiriq.

KORPUS LINGVISTIKASI

Manzura Abjalova

~ 85 ~
3-topshiriq.

4-topshiriq.

Manzura Abjalova

~ 86 ~
ILOVALAR

1-ILOVA. INTERNET TARMOG‘IDAGI KORPUSLAR

Korpuslar nomi
So‘zshakllar
miqdori
O‘zbek tilining ta’limiy korpusi.
http://uzschoolcorpara.uz/

Rus tilining milliy korpusi
Национальный корпус русского языка
http://ruscorpora.ru
1.5
mlrd.dan
ko‘p
XX ars oxiridagi rus gazetalari matnlarining
kompyuterli korpusi
Компьютерный корпус текстов русских газет
конца ХХ века
http://www.philol.msu.ru/~lex/corpus
200 ming
so‘zshaklga
yaqin
Rus tilining XANKO korpusi
Корпус русского языка ХАНКО (Хельсинский
университет)
http://www.ling.helsinki.fi/projects/hanco
100 ming
so‘zshakl
Ruscha matnlarning Upsala korpusi
Уппсальский корпус русских текстов
http://www.sfb441.uni-
tuebingen.de/b1/en/korpora.html
1 mln
so‘zshakl
A.S.Griboyedov tili lug‘at-korpusi
Словарь-корпус языка А.С. Грибоедова
http://www.inforeg.ru/electron/concord/concord.htm
120 ming
so‘zshakl
Ingliz tili banki
Банк английского языка (Bank of English)
http://www.collins.co.uk/books.aspx?group=153
Erkin kirish:
http://www.collins.co.uk/Corpus/CorpusSearch
524 mln.
so‘zshakl,
56 mln.
erkin kirish
shaklida
Venger milliy korpusi
http://corpus.nytud.hu/mnsz/
100 mln.
so‘zshakl

KORPUS LINGVISTIKASI

Manzura Abjalova

~ 87 ~
Ispan tili korpusi (AQShning Illunoys universitetida
yaratilgan)
Корпус испанского языка (исторический)
http://www.corpusdelespanol.org/
XIII-XX asr
matnlariga
tegishli 100
mln.
so‘zshakl
Nemis tilining Mangeym korpusi
(Institut für Deutsche Sprache, Mannheim,
Germany)
http://corpora.ids-mannheim.de/~cosmas/
1610 mln.
so‘zshakl
“Persey”ning lotincha matnlari korpusi
Корпус латинских текстов «Персей»
http://www.perseus.tufts.edu

Zamonaviy Daniya tili korpusi
Корпус современного датского языка
http://www.korpus2000.dk/
1998–2002-
yillarga
tegishli
matnlardagi
50 mln.
so‘zshakl
Zamonaviy italyan tili korpusi
CORIS/CODIS
http://www.cilta.unibo.it/ricerca.htm
100 mln.
so‘zshakl
Zamonaviy xitoy tili korpusi
(LIVAC Synchronous Corpus)
http://www.rcl.cityu.edu.hk/livac/
720 mln.
so‘zshakl
(150 mln.
iyeroglif)
Sloven tili milliy korpusi
http://www.fida.net/eng/
100 mln.dan
oshiq
so‘zshakl
Bolgar tili milliy korpusi
http://search.dcl.bas.bg
320 mln.
so‘zshakl

Manzura Abjalova

~ 88 ~
2-Ilova. Ayrim korpuslarning bosh sahifalaridan namunalar.

1.

O‘zbek tilining ta’limiy korpusi. http://uzschoolcorpara.uz/

Rus tilining milliy korpusi (Национальный корпус русского
языка).

https://ruscorpora.ru/

KORPUS LINGVISTIKASI

Manzura Abjalova

~ 89 ~
2.

Fransuzcha matnlar korpusi (La Bilbiothèque Universelle).
http://abu.cnam.fr/

3.

Chex milliy korpusi (Český národní korpus). www.korpus.cz

Manzura Abjalova

~ 90 ~
4.

Xorvat
milliy
korpusi
(Hrvatski
nacionalni
korpus)
www.hnk.ffzg.hr

KORPUS LINGVISTIKASI

Manzura Abjalova

~ 91 ~
3-Ilova. Mashhur korpuslarning lingvistik izohlanish holati

t/r
Korpus nomi
Elektron manzili
Lingvistik izohlanishi

Britan milliy korpusi
(British National Corpus,
BNC)
http://www.natcorp.ox.ac.uk/;
http://corpus.byu.edu/bnc
XX asr oxiri – XXI asr boshlaridagi
matnlarni qamrab olgan ingliz tilidagi
og‘zaki va yozma matnlar korpusi.
So‘zshakl miqdori 100 mln. Morfologik
izohga ega.

Amerikancha
milliy
korpus
(American
National
Corpus, ANC)

http://www.anc.org/

XX asr oxiri – XXI asr boshlariga tegishli
matnlarni qamrab olgan ingliz tilining
Amerika versiyasiga oid og‘zaki va yozma
matnlar korpusi. So‘z miqdori 22 mln.
Morfologik va qisman sintaktik izohga
ega.

Ispan
tili
korpusi
(Сorpus del español)

http://www.corpusdelespanol.org/

XIII-XX asr matnlarini o‘z ichiga oladi.
Taxminan 100 mln so‘zdan iborat. So‘z
turkumlari
teglari
va
metalingvistik
ma’lumotlar mavjud.

Zamonaviy ispan tili
korpusi
(Corpus
del
español
actual, CEA)

http://sfn.uab.es:8080/SFN/tools/
cea/english

Vikipediya matnlari va huquqiy hujjatlarga
tegishli (BMT qarorlari va Yevropa
parlamenti hujjatlari) 540 mln.ga yaqin
lemmatizatsiyalangan hamda morfologik
izohli so‘zlarni o‘z ichiga oladi.

Italyan
tili
korpusi
(Corpus
di
Italiano
http://corpora.dslo.unibo.it

Taxminan 130 mln so‘zdan iborat bo‘lib,
zamonaviy yozma italyan matnlarini o‘z

Manzura Abjalova

~ 92 ~
Scritto)

ichiga oladi. So‘z turkumlari teglangan,
xolos.

Nemis
tili
korpusi
Cosmas II
(das Projekt COSMAS II)

http://www.ids-
mannheim.de/cosmas2/

Umumiy hajmi 8,7 milliard so‘zdan ortiq
bo‘lgan 100 dan ortiq turli xil kichik
korpuslarni birlashtirgan Germaniya milliy
korpusining ikkinchi versiyasi. Morfologik
va sintaktik izohlarni o‘z ichiga oladi.

Fransuz tilining leksik
ma’lumotlari
bazasi
FRANTEXT
(le corpus Frantext)
http://artfl-project.uchicago.edu

Afsuski, fransuz tilining yaxshi milliy
korpusi mavjud emas. Mazkur korpusning
umumiy hajmi 200 mln so‘zdan ortiq.
XVIII-XX asr matnlar to‘plangan, ammo
lingvistik izohlar berilmagan.

Yunon milliy korpusi
(Εθνικός
Θησαυρός
Ελληνικής Γλώσσας)
http://hnc.ilsp.gr/en
XX asrning ikkinchi yarmi va XXI asr
boshlariga oid turli janrdagi 47 milliondan
ortiq so‘zlardan iborat korpus. Lemmalar
izohi va so‘z turkumlari teglanishiga ega.

Xitoy tilining Lankaster
korpusi
(LCMC,
Lancaster
Corpus
of
Mandarin
Chinese)
www.lancaster.ac.uk/fass/projects/
corpus/ LCMC
Xitoy tilining zamonaviy mandarin tilida
yozilgan
matnlardan
iborat
bo‘lib,
taxminan 1 mln LB mavjud. Matnlarga
meta-belgilar ko'rsatiladi, so‘z turkumi
teglari mavjud.

Download 4,46 Mb.

1 ... 62 63 64 65 66 67 68 69 ... 76

Download 4,46 Mb.

Pdf ko'rish