O korpusie

Niniejsza strona zawiera zindeksowany w wyszukiwarce MTAS milionowy podkorpus Narodowego Korpusu Języka Polskiego (tzw. NKJP1M) wzbogacony o warstwę ręcznie anotowanych wyrażeń kwantyfikujących. W korpusie pozostawiono wszystkie istniejące wcześniej w NKJP1M warstwy anotacji, czyli m.in. warstwę morfosyntaktyczną, warstwę grup składniowych oraz warstwę jednostek nazewniczych.

Korpus powstał w ramach projektu „Kwantyfikatory: użycie i znaczenie”. Źródłową wersję korpusu można pobrać w postaci archiwum plików XML.

W wypadku wykorzystania warstwy znakowania kwantyfikatorów z tego korpusu w badaniach naukowych prosimy o cytowanie artykułu:

Szymanik, J., Kieraś, W., The semantically annotated corpus of Polish quantificational expressions, Language Resources and Evaluation, 56(3):1057–1074, 2022