Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

Inleiding in HPSG

Head-driven Phrase Structure Grammar [Pollard & Sag 1991], voortaan afgekort met HPSG, is een voortzetting van veel onderzoekstradities in de syntaxis. HPSG was betrokken bij principieel niet-derivationele benaderingen, zoals Categorial Grammar (CG), Generalized Phrase Structure Grammar (GPSG) en Lexical Functional Grammar (LFG). In de semantiek werd de Situatie-semantiek als leidraad genomen en van de informatica de datatype-theorie, kennisrepresentatie en unificatie-gebaseerde formalismen.

In HPSG wordt gebruik gemaakt van een systeem van getypeerde featurestructuren. Hierbij wordt uitgegaan van de notie sign van Saussure. Een sign (of: teken) is te beschouwen als een bouwsteen of basiselement. Een sign in de vorm van een attribute value matrix (avm) ziet er schematisch als volgt uit:

Featurestructuren kunnen worden beschreven in een graaf of in avm-diagrammen. Deze featurestructuren kunnen zelf weer gebruikt worden als beschrijvingen van andere featurestructuren. Iedere featurestructuur is van een bepaald type. We spreken daarom van getypeerde featurestructuren (typed feature structures). Zo is [ HEAD noun ] van het type nominal en [ HEAD verb ] van het type verbal.

De informatie over subcategorisatie of valentie is in HPSG vastgelegd in het lexicon onder het feature SUBCAT van de betreffende lexicale ingang. De SUBCAT-lijst voorziet dus in de informatie van subcategorisatie-eisen. De geschikte waarden van SUBCAT zijn lijsten van tekens. Een teken dat subcategoriseert voor n andere tekens heeft als SUBCAT-waarde een lijst van n (meestal zeer partieel gespecificeerd) tekens. Bij gesatureerde tekens is de SUBCAT-waarde een lege lijst.

De gebruikelijke categoriesymbolen kunnen we nu definiëren in termen van featurestructuren van het type sign. NP en S zijn gesatureerde tekens met als hoofd respectievelijk nomina en verba. De VP is een ongesatureerd teken, omdat alleen nog het subject ontbreekt om een volledige zin te vormen. De symbolen voor de categorieën kunnen we gebruiken als afkortingen van featurestructuren. Deze symbolen kunnen dan weer recursief gebruikt worden in andere featurestructuren, zoals in de definitie van VP waarin "NP" optreedt in de SUBCAT-specificatie.

De opbouw van woordgroepen is eveneens vast te leggen in een featurestructuur. Woordgroepen bevatten namelijk het attribuut DTRS, waarvan de waarde een featurestructuur is van het type constituent-structure, afgekort met con-struc, die de immediate-constituentstructuur van de woordgroep representeren. Het subtype is headed-structure, voorkomend in alle endocentrische constructies. Het zijn structuren die uitgaan van het hoofd. De attributen voor het type headed-structure zijn:


De globale structuur van een endocentrische structuur is als volgt:


Iedere endocentrische structuur heeft een unieke dochter als hoofd, terwijl er meer (of geen) dochters als complement kunnen optreden. De volgorde op de COMP-DTRS-lijst wordt bepaald door de toenemende obliqueness.

Hieronder volgt een voorbeeld van de structuur van een eenvoudige woordgroep waarvan de DTRS-waarde een head-complement-structuur (head-comp-struc) is:

De specificatie van de DTRS-waarde voor een woordgroep kan dezelfde informatie dragen als een gebruikelijke constituentenboomstructuur, alleen wordt hier bij iedere dochter vermeld wat het `grammaticale type' erbij is, zoals Hoofd (H), Complement (C) of Adjunct (A).

Het HeadFeature-Principe houdt in dat de HEAD-waarde van een teken (sign) altijd via structure-sharing verbonden is met de HEAD-waarde van zijn woordgroepprojectie. Het effect van HFP is om te garanderen dat endocentrische woordgroepen werkelijk projecties zijn van hun hoofden.

In de volgende paragraaf zal ik meer detail ingaan op subcategorisatie. De vraag hoe subcategorisatie in HPSG verwerkt wordt, zal daarin beantwoord worden.

Vervolg: Verwerking van subcategorisatie in HPSG



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025