Instrukcja


W korpusie zindeksowano istniejące wcześniej w NKJP1M warstwy: znaczników morfosyntaktycznych, grup składniowych i jednostek nazewniczych oraz dodano do niego warstwę wyrażeń kwantyfikujących.

Podstawowa warstwa korpusu to warstwa morfosyntaktyczna, dzieląca tekst na segmenty oraz nadająca tym segmentom interpretację fleksyjną: formę podstawową, klasę gramatyczną i wartości przysługujących im kategorii gramatycznych. Warstwa grup składniowych indeksuje jednostki jedno- lub wielosegmentowe o określonej klasyfikacji składniowej: grupy nominalne (NG), liczebnikowe (NumG), przymiotnikowe (AdjG), przyimkowo-nominalne (PrepNG), przyimkowo-przymiotnikowe (PrepAdjG), przyimkowo-liczebnikowe (PrepNumG), przysłówkowe (AdvG), zdania podrzędne (CG) czy zdania podrzędne pytajne (KG). Grupy składniowe można wyszukiwać za pomocą znacznika <g /> z opcjonalnym doprecyzowaniem typu grupy, np. <g=”NumG” />. Z kolei do warstwy jednostek nazewniczych można odnosić się przez znacznik <ne /> (ich wewnętrzną klasyfikację opisano m.in. w instrukcji Korpusomatu w części 3.7).

Warstwa wyrażeń kwantyfikujących składa się z jednostek jedno- lub wielosegmentowych opisanych ze względu na ich własności semantyczne. Kwantyfikatorem lub wyrażeniem kwantyfikującym nazywamy jednostkę wypowiedzenia wyrażającą liczbę lub ilość i dającą się opisać formalnie jako relacja pomiędzy dwoma zbiorami. Najbardziej znane wyrażenia kwantyfikujące to te znane z logiki — czy to z sylogistyki Arystotelesowskiej, czy też z logiki pierwszego rzędu, np. każdy, pewien, żaden.

Cechy semantyczne kwantyfikatorów opisane w korpusie to:

  1. Typ D lub A (według klasyfikacji pochodzącej od Barbary Partee) — w strukturze predykatowo-argumentowej zdania kwantyfikator typu D współtworzy (lub wiąże) argument głównego predykatu, kwantyfikator typu A zaś — modyfikuje lub współtworzy sam predykat.
  2. Podtyp: kwantyfikator egzystencjalny (exst), uniwersalny (univ), proporcjonalny (prop) oraz numeryczny (num) — przy czym kwantyfikator numeryczny to tylko technicznie wyróżniony podtyp kwantyfikatora egzystencjalnego wyrażony liczbą.
  3. Lewostronna monotoniczność — wartości: rosnąca (inc), malejąca (dec), niemonotoniczna (nmon).
  4. Prawostronna monotoniczność — wartości j. w.
  5. Typ porównawczy: równy (pos), wyższy (com), najwyższy (sup).

Wyrażenia kwantyfikujące można wyszukiwać w korpusie za pomocą znacznika <q /> z opcjonalną specyfikacją ich cech semantycznych opisanych powyżej i w takiej samej kolejności. Wartości poszczególnych cech muszą być oddzielone dwukropkami. Przykładowo zapytanie:
<q="D:prop:nmon:inc:pos" />
powinno zwrócić kwantyfikator typu D, proporcjonalny, lewostronnie niemonotoniczny, prawostronnie rosnący o typie porównawczym równym, czyli przede wszystkim kwantyfikator większość oraz podobne.

W polu wartości cech semantycznych można używać wyrażeń regularnych, dzięki czemu w zapytaniach nie trzeba specyfikować wszystkich cech. Przykładowo, zapytanie:
<q="D:.*" />
zwróci wszystkie kwantyfikatory typu D bez względu na ich inne cechy, zaś zapytanie:
<q=".*:exst:.*" />
zwróci wszystkie kwantyfikatory egzystencjalne.

W zapytaniach można również korzystać ze wszystkich relacji między zindeksowanymi w korpusie jednostkami z różnych warstw, które opisano w specyfikacji wyszukiwarki MTAS. Przykładowo, można wyszukać wszystkie takie kwantyfikatory, które zawierają segment o formie hasłowej żaden:
<q /> containing [base="żaden"]
lub kwantyfikatory składające się z segmentów tworzących grupę liczebnikową z warstwy składniowej:
<q /> fullyalignedwith <g="NumG" />