Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

AMAZON/CASUS

Inleiding

Het AMAZON/CASUS-systeem [Van Bakel 1984; Coppen 1991; Coppen & Van der Ende 1993; Coppen et al. 1993] analyseert Nederlandse zinnen tot een semantische representatie waarin woordgroepen semantische functies (zoals Agens, Datief, Object) vervullen bij semantische kernen (bijv. Verbum, Nomen, Adjectief).

Het AMAZON/CASUS-model is opgebouwd uit onafhankelijke modules die ieder hun resultaat doorgeven aan de volgende. Er is hier dus voor een modulaire aanpak gekozen. Het model bestaat uit twee hoofdmodules AMAZON en CASUS. De module AMAZON zorgt ervoor dat Nederlandse zinnen geanalyseerd worden naar oppervlaktestructuren. Subcategorisatie is niet verwerkt in deze module. CASUS is de module die thematische rollen toekent aan de syntactische argumenten. Uiteindelijk wordt dus een semantische representatie opgeleverd. De structuur wordt in ieder geval verrijkt met semantische informatie. Een hoofdwerkwoord V, een semantische kern, deelt steeds bepaalde rollen uit:

    V (rol1, ..., roln)

Deze semantische rollen moeten worden toegekend aan argumenten, bijvoorbeeld NC's (= NP's), PC's (= PP's) en SE's (= bijzinnen). In CASUS worden casusrollen van [Fillmore 1968] gebruikt.

In CASUS(90) was het resultaat in de vorm van dependentiestructuren waarin afhankelijkheden rond semantische kernen worden uitgedrukt. Dit is te vergelijken met de structuren Functie/Predikaat – Argumenten. Er werd geprobeerd de oppervlaktestructuur van AMAZON te vertalen naar de bijbehorende dieptestructuur. Na terug-verplaatsingen en na het toekennen van de rollen aan de argumenten, ontstond een uniforme dependentiestructuur. De oorspronkelijke volgorde van de lexicale elementen van de invoer wordt dus niet gehandhaafd in de resultaatstructuur.

De huidige CASUS-module, CASUS(92), levert geen dependentiestructuren meer af, maar een "verrijkte'' oppervlaktestructuur waarin de volgorde van lexicale elementen gehandhaafd blijft door middel van het gebruik van sporen met indices. Sporen en indices leiden in deze aanpak een constituent naar de plaats waar hij zijn semantische rol krijgt.

Het ProjectiePrincipe, Theta-criterium en het Casusfilter kunnen bewerkstelligen dat lege elementen als PRO en DUMMY worden toegevoegd. Deze principes van Government & Binding (GB) kunnen verklaren waarom bepaalde zinnen grammaticaal zijn en andere zinnen juist ongrammaticaal. Als een structuur een van deze principes schendt, dan wordt die structuur uitgefilterd. Deze principes kunnen dus tegelijk als Filters werken op structuren.

Eerst is er de lexicalisering van de invoer. In de lexicale module worden de woorden voorzien van lexicale categorieën. Vervolgens wordt de gelabelde Nederlandse zin door de module AMAZON geanalyseerd naar oppervlaktestructuren. De beschrijving van de oppervlaktestructuur is gebaseerd op de structuralistische grammatica uit Rijpma, Schuringa & Van Bakel (1968). Zo'n oppervlaktestructuur beschrijft in de Nederlandse zin een tangconstructie. Hierin worden het eerste zinsdeel (TOP), het middenstuk (MI) en de uitloop (UL) in de greep gehouden door werkwoordelijke polen, de persoonsvorm (PV) en het werkwoordelijk cluster (CL).

Een zin als Jan heb ik verteld dat het allemaal goed is gegaan had precies dezelfde structuur gehad. Dit geeft al aan dat AMAZON geen interpretatie van semantische functies geeft, maar puur een oppervlaktestructuur op syntactische gronden.

In de grammatica Preparations wordt de AMAZON-structuur aangepast. Na de voorbereidingen die zorgen voor de normalisatie van hoofd- en bijzin, volgt de cyclische grammatica Interpret-Cycle. Hierin worden de subcategorisatie-eisen en selectierestricties gecontroleerd.



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025