Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

Verwerking van subcategorisatie in EUROTRA

ERS en IS zijn beide dependentiestructuren waarin het regerende element, een lexicale hoofdcategorie (zoals V), een zuster is van zijn dependanten. De representaties op ERS en IS moeten voldoen aan de eisen van volledigheid en coherentie. Om zowel volledig als coherent te zijn, moeten ze alle en alleen die complementen bevatten die vereist worden door het subcategorisatieframe van hun governor. Het onderscheid tussen hoofd en complement en adjunct is niet configurationeel weergegeven via structurele relaties of niveaus in een bepaalde hiërarchie in de boomstructuur maar in de vorm van verschillende naamgeving van de knooplabels (gov, arg, mod).

In ERS moet voldaan worden aan de categoriale eisen die het hoofd oplegt aan zijn complementen (categorieselectie), terwijl in IS het hoofd – onafhankelijk van de syntactische subcategorisatie – semantische argumenten verwacht. We zien dat syntactische subcategorisatie gescheiden is van de semantische selectie.

In EUROTRA is de volgende onderverdeling in typen argumenten gemaakt:


arg1: diepte-subject; AGENS
arg2: diepte-object; PATIENS / THEMA
arg3: kan alles zijn behalve arg1 of arg2 in een drie-plaatsig predikaat;
in vier-plaatsige constructies is het het indirect object of Bron;
attributen van objecten
  • arg_P2: tweede participant (bezield); DOEL/ONTVANGER
  • arg_2E: tweede entiteit (onbezield); DOEL/BRON/PLAATS
  • arg_AS: attribuut van subject (subjectcomplement); secundaire statische predikatie over subject
  • arg_AO: attribuut van object (objectcomplement); secundaire statische predikatie over object
  • arg_Pe: datief-waarnemer; datief-waarnemer bij raising-predikaten
arg4: frame-gebonden PP's die anders niet geïndexeerd zijn;
bijvoorbeeld adjunct-argumenten die uitgedrukt worden door een zwak of sterk gebonden voorzetsel
  • arg_PLACE: arg_adjunct [+Plaats]
  • arg_ORIGIN: arg_adjunct [+Bron]
  • arg_GOAL: arg_adjunct [+Doel]
  • arg_MANNER: arg_adjunct [+Hoedanigheid]
  • arg_MEASURE: arg_adjunct [+Maat]
  • arg_ASSOC: arg_adjunct [+Associatie]

Een argumentstructuur bestaat uit een extern argument en interne argumenten eventueel gecombineerd met een aantal andere beperkte argumenttypen. Hieronder zal duidelijk worden gemaakt wat de motivatie was in EUROTRA om gebruik te maken van argumentstructuren. De theorie is in eerste instantie niet meer gebaseerd op de volgorde van complementen, maar is gebaseerd op noties afkomstig van een theorie van onderliggende syntactische functies zoals diepte-subject en diepte-object. Deze diepte-functies zijn soms verder gedifferentieerd met meer semantische kenmerken ten gunste van de indexatie van predikaten met een hogere valentie (tri- en tetravalente predikaten). De argumentstructuur kan gebruikt worden als een representatie om:

In de argumentstructuur worden de argumenten nauwelijks gespecificeerd: arg1, arg2, arg3, arg4. Zo'n minimale typering van argumenten kan zinvol zijn waar een rol moeilijk te karakteriseren is of waar een argument meer dan één rol schijnt te vervullen. Een minimale typering bevordert intercodeerconsistentie en minimaliseert daardoor een complexe tranfer. In veel gevallen is het toevoegen van alleen lexicaal-semantische features voldoende om een correcte lexicale selectie in de transfer te garanderen.

Hieronder zal ik in het kort bespreken hoe de controle van subcategorisatie plaatsvindt op het niveau ERS.

Elk afzonderlijk frame wordt beschreven door een aparte b-regel. Als complementen altijd verplicht aanwezig zouden zijn in de structuur en er altijd een duidelijk verschil zou zijn met modifiers, dan zou een opsomming van b-regels volstaan om zowel de volledigheid als de coherentie van een frame te controleren. Het is echter zo dat in veel frames de complementen optioneel zijn. Ook het verschil tussen complementen en modifiers wordt moeilijker te onderscheiden: beide kunnen bijvoorbeeld in de vorm van een PP optreden. Deze informatie aangaande de optionaliteit/verplichtheid van complementen moet opgenomen worden in de ERS-frames van de werkwoorden. Dit kan als volgt uitgedrukt worden: COMPL_n = OBL/OPT. Een b-regels die een bepaald frame beschrijft, kan bepaalde complementen als optioneel markeren. Strict-regels en filter-regels worden gebruikt om condities van volledigheid en coherentie te formuleren. Zo kan een strict-regel afdwingen dat een bepaald complement een bepaalde functie heeft. Een killer-regel kan structuren ongedaan maken waar een verplicht complement is vereist maar niet aanwezig is.

Bij de mapping van ERS naar IS worden allerlei hypothesen gepostuleerd. De hypothesen worden getoetst aan de hand van het casusframe of de verzameling semantische argumenten die het werkwoord verwacht. We hebben een 'zwakke structuur' die nog niet geconsolideerd is: bepaalde elementen kunnen nog veranderen. Met mapping-regels wordt een configuratie van semantische argumenten als hypothese voorgesteld. Indien de hypothese van rolverdeling toegepast op de 'zwakke structuur' niet voldoet aan de eisen van volledigheid en coherentie, dan wordt de structuur uitgefilterd. Er wordt een IS-structuur opgeleverd als de voorgestelde argumenten wel voldoen aan het casusframe.

De argumenten (arg1, arg2, arg3, arg4) die in EUROTRA gebruikt worden, vormen een belangrijk onderdeel in het bereiken van een interface-structuur van syntaxis naar semantiek. Het syntactische niveau is in het EUROTRA-model goed gescheiden van het semantische niveau. De controle van subcategorisatie gebeurt in termen van categorieën en functies. Op het niveau van IS wordt geabstraheerd van de concrete categoriale waarde van argumenten. Daar wordt gewerkt met argumenten zoals is weergegeven. Uiteindelijk gaat het om de semantische argumenten bij de semantische kern V. Door alleen te werken met een argumentstructuur, kan de transfer van IS(brontaal) naar IS(doeltaal) eenvoudig blijven. Argumenten vormen hier min of meer de elementen van overbrugging, om van de ene naar de andere taal te komen.



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025