Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

Grammaticale functies tegenover syntactische argumenten

In plaats van syntactische argumenten zou een ander type van min of meer hetzelfde of een iets ander abstractieniveau genomen kunnen worden. De traditionele grammaticale functies, zoals subject, direct object, indirect object, zouden hier voor in aanmerking kunnen komen. Ze zijn te beschouwen als metacategorieën: categorieën over categorieën. Ze geven de grammaticale relatie van de categorieën ten opzichte van de zin aan. Subcategorisatie zou in termen van grammaticale functies kunnen worden uitgedrukt. Voor deze aanpak kiest Grimshaw (1982). De subcategorisatie-eisen in termen van grammaticale functies zien er als volgt uit:

S-frames in functies:
lachen : SU [ ]
zien : SU [ DO ]
wachten : SU [ PO ]
geven : SU [ IO DO ]

Grammaticale functies zijn in bepaalde opzichten vergelijkbaar met syntactische argumenten. Zo wordt namelijk ook geabstraheerd over syntactische categorieën. Er is sprake van een type op een abstracter niveau. Ik kies echter niet voor de benadering van Grimshaw waar grammaticale functies als belangrijkste type elementen worden gezien die het werkwoord selecteert, de zogeheten functionele subcategorisatie [Grimshaw 1982]. Hier heb ik twee redenen voor: enerzijds kleven er nadelen aan deze functionele subcategorisatie, anderzijds mist de benadering met grammaticale functies de voordelen van de benadering met syntactische argumenten in de S-frames.

Het enige voordeel dat het gebruik van grammaticale functies biedt, zoals het verschillende syntactische gedrag van de afzonderlijke grammaticale functies, geldt ook in de benadering met syntactische argumenten als daarbij een nieuw type wordt toegevoegd, en wel het semantische type: de thematische rollen. Hier zal ik nog nader op ingaan.

Laat ik eerst de nadelen en de problemen van het gebruik van grammaticale functies bespreken.

Ten eerste zijn grammaticale functies, die de grammaticale relaties tussen de grammaticale objecten (categorieën) weergeven ten opzichte van de zin, in syntactische boomstructuren redundant, omdat deze functies af te leiden zijn uit de structurele positie in de boomstructuren. De primitieven 'subject' en 'object' zijn namelijk uit te drukken in structurele relaties:

subject: [Spec,VP]
object: [Spec,V']

We zouden dan echter de structuur al opgebouwd hebben (via afleiding). Hier moeten we beginnen met de basis. We hebben niets, dus ook geen dieptestructuur (D-structuur). Na lexicale insertie via Subcategorisatie-regels krijgen we uiteindelijk de D-structuur. In het lexicon kunnen we daarom wel gebruik maken van syntactische functies die al de relaties aangeven tussen de grammaticale objecten (categorieën). Maar het probleem is dat er al iets wordt uitgedrukt wat nog gaat komen. Zodra de gehele boomstructuur is opgebouwd, zijn de functionele categorieën, zoals de grammaticale functies, overbodig. De differentiatie in grammaticale functies komt eerder voort uit de verschillende structurele relaties. De structuur bepaalt dus de uiteindelijke grammaticale functies van de categorieën. Er ontstaat redundantie als deze functies al als primitieven in de S-frames worden gebruikt.

Als er een één-op-één-relatie gold tussen vorm en functie, dan zouden enkel grammaticale functies of enkel syntactische categorieën volstaan. De syntactische categorieën zouden dan achterwege kunnen blijven, omdat deze dan uit de grammaticale functies af te leiden zouden zijn, en vice versa. Een dergelijke overeenkomst tussen grammaticale functie en syntactische categorie bestaat echter niet [Grimshaw 1982]. Een direct object kan bijvoorbeeld bij het ene werkwoord alleen door een bepaalde categorie, bijvoorbeeld NP, worden gerealiseerd, terwijl dit object bij een andere werkwoord een andere categoriale realisatie, bijvoorbeeld een PP of bijzin, oplevert. In de benadering van Grimshaw wordt deze één-op-één-relatie wel bewerkstelligd door als het ware de categorie te coderen in de functienaam. Zo krijgen we de functienamen 'direct object', 'prepositional object' en 'clause' in plaats van de grammaticale functie 'object' gerealiseerd door respectievelijk een NP, PP en een bijzin. Het is zeer te betwijfelen of in deze aanpak van Grimshaw deze verschillende functienamen ook verschillende grammaticale functies omvatten. Het is aannemelijker dat het hier gaat om dezelfde grammaticale relatie of functie die door verschillende categorieën verwezenlijkt is. In deze benadering zijn dan ook twee typen verward: de meta-categorie (het type van de categorie over de categorie) en de categorie zelf. Als de beide typen in een één-op-één-relatie tot elkaar zouden staan, dan zou er duidelijk sprake zijn van redundantie. De categoriale informatie is immers ook al gecodeerd in de functienamen. Uiteindelijk kunnen we dan niet meer spreken van een onderverdeling in grammaticale functies. Iedere nieuwe combinatie tussen functie en categorie levert een nieuwe naam op. We moeten er echter voor zorgen dat linguïstische informatie op verschillende niveaus gescheiden blijft: informatie op het functionele niveau (niveau 1) en informatie op het categoriale niveau (niveau 2).

De beschrijving van subcategorisatie in termen van alleen grammaticale functies is nooit toereikend, zoals ook het geval is bij het gebruik van alleen argumenten in het S-frame. Subcategorisatie-effecten zoals categorie- en prepositieselectie van het werkwoord, kunnen met alleen grammaticale functies niet adequaat verantwoord worden.

De prepositieselectie, namelijk welk voorzetsel het prepositioneel object neemt, is direct afhankelijk van het werkwoord en niet van de grammaticale functie zelf. Het werkwoord selecteert een vast voorzetsel. Het werkwoord bepaalt dus welke vorm het voorzetsel aanneemt in het prepositioneel object. Er zijn daarbij sterke argumenten die ervoor pleiten om het voorzetselvoorwerp (prepositioneel object) eerder als lijdend voorwerp (direct object) te beschouwen met een geadjungeerd voorzetsel [Van den Toorn 1971].

Het uitgangspunt dat een voorzetselvoorwerp een gewone PP vertegenwoordigt die door het werkwoord als geheel geselecteerd wordt, lijkt mij onjuist. Het voorzetselvoorwerp is namelijk geen gewone PP, maar eerder een NP met een geadjungeerde prepositie: P+[NP]. In de analyse P+[NP] wordt tot uitdrukking gebracht en verklaard waarom er verder op veel punten niets PP-achtigs mogelijk is bij het voorzetselvoorwerp. Hieronder zal ik deze nieuwe analyse voor het voorzetselvoorwerp onderbouwen.

Een eigenschap van een PP is dat de Specificeerder/Specifier-positie ervan nog gevuld kan worden met een P-bepaling zoals een bijwoord pal/vlak/direct of een nadere positiebepaling zoals binnen/voor/achter.

label{vb-spec-pp}
hij staat [(pal/vlak/direct) VOOR/ACHTER de deur]
hij woont [(pal/vlak/direct) BIJ/AAN de rivier]
hij bevindt zich [(binnen/voor/achter) in de grot]
dat is gebeurd [(vlak/direct) VOOR/NA die historische gebeurtenis]

Allereerst is het voorzetsel van een PO niet uit te breiden met canonieke P-bepalingen. P-bepalingen staan op de Specifier-positie van de PP [Spec,PP], zoals \ref{vb-spec-pp} laat zien.

label{vb-bij-vzv-ongrammaticaliteit-spec-pp}
hij is bang [(*pal/*vlak/*direct/*binnen) VOOR de boze wolf]
hij zwoer [(*pal/*vlak/*direct/*binnen) BIJ deze oplossing]
hij geloofde [(*binnen/*voor/*achter) IN die stelling]
hij denkt [(*pal/*vlak/*direct/*binnen) AAN haar]

Ten tweede kan het voorzetsel bij een voorzetselvoorwerp niet echt dienen als hoofd van die veronderstelde PP. Het voegt geen betekenis toe aan de gehele woordgroep. Het vaste voorzetsel treedt op als dummy en wordt door het werkwoord bepaald. Het voorzetsel in een canonieke PP is daarentegen wel het hoofd van de gehele woordgroep. Het voegt immers, onafhankelijk van het werkwoord, betekenis toe aan de rest van de PP. Het betreft dan meestal een dimensionale of locatieve toevoeging.

hij zit [op een stoel]

Het voorzetsel op geeft de positie van het zitten aan: waarop wordt gezeten: niet onder, naast, tussen of tegen, maar (boven)op een stoel.

De laatste aanwijzing die laat zien dat het werkwoord niet direct een autonome PP selecteert, is de onmogelijkheid tot inbedding. Een voorbeeld van vrezen voor tegenover wonen kan dit duidelijk maken. De combinaties van P+NP zijn al dan niet ingebed als nabepaling van een NP.

label{vb-pp-inbedding}
zij vreest [voor de boze wolf [in het bos]]
zij vreest ([in het bos]) [voor de boze wolf]
* zij vreest [in het bos [voor de boze wolf]] \footnote{Hier moet wel de betekenis van bang zijn voor (iets/iemand) gehandhaafd blijven.
zij woont [naast de winkel [tegenover een voetbalveld]]
zij woont [tegenover een voetbalveld [naast de winkel]]

We kunnen vaststellen dat het werkwoord en het voorzetsel van het voorzetselvoorwerp op hetzelfde niveau staan. Er is een soort regeerrelatie tussen het werkwoord en het vaste voorzetsel. Deze relatie blijkt ook uit het feit dat het voorzetsel afzonderlijk door het werkwoord wordt geselecteerd. Bij inbedding staat het vaste voorzetsel niet meer op gelijk niveau met het werkwoord. Het werkwoord kan het voorzetsel dan niet meer regeren, zodat ongrammaticaliteit ontstaat. Als we het voorzetselvoorwerp beschouwen als een gewone PP, dan zouden we verwachten dat inbedding wel mogelijk zou zijn. Bij een normale PP is inbedding immers mogelijk.

We moeten concluderen dat we het voorzetselvoorwerp niet kunnen beschouwen als gewone PP. Het voorzetsel van het voorzetselvoorwerp is onlosmakelijk met het werkwoord verbonden. Het voorzetsel vormt dan ook eerder met het werkwoord dan met de NP een eenheid. Dit is ook af te leiden uit het feit dat het werkwoord en het vaste voorzetsel op hetzelfde niveau staan. Zoals we zagen in \hetvb, is inbedding van het voorzetselvoorwerp niet mogelijk. Het voorzetsel behoort dus op hetzelfde niveau te blijven staan als het werkwoord dat het betreffende voorzetsel selecteert. Het voorzetsel is niet het hoofd van de woordgroep, zoals dat wel het geval is bij gewone PP's. De stelling is dan gerechtvaardigd dat we het voorzetselvoorwerp eerder moeten zien als een lijdend voorwerp (NP-object) waaraan een dummy-voorzetsel is geadjungeerd.

Het indirect object zouden we ook als object kunnen beschouwen met een geadjungeerd voorzetsel aan. Daar zijn argumenten voor gegeven in verband met anaforische relaties:

we hebben aan Jan zichzelf aangeraden.

Als deze zin goed is, dan zou Jan de anafoor zichzelf moeten c-commanderen, want zichzelf moet, als gebonden anafoor, een c-commanderend antecedent vinden. Maar als aan Jan een PP is, c-commandeert Jan niet zichzelf. Wanneer we nu stellen dat aan een geadjungeerde casusmarkeerder is bij de NP Jan, wordt aan die c-commandrestricties wel voldaan. Hetzelfde verschijnsel zien we bij argumenten van nomina:

een boek van Vestdijk over zichzelf

Deze zin kan alleen begrepen worden als Vestdijk het subject van het nomen is (niet als Vestdijk een possessief is).

Het probleem met deze argumentatie in het kader van het voorzetselvoorwerp is, dat de schaarse werkwoorden met voorzetselvoorwerp en lijdend voorwerp het voorzetselvoorwerp bij voorkeur achteraan hebben.

*? we vergeleken met Jan zichzelf
*? we vergeleken met Jan Piet

De laatste is alleen mogelijk met heavy NP:

we vergeleken met Jan iedereen die we maar tegen kwamen.

Het probleem is nu dat zichzelf geen heavy NP kan zijn.

Constructies met vrije anaforen zoals persoonlijke voornaamwoorden (hem) lijken voor de P+[NP]-analyse te pleiten.

* we vergeleken met 'mi iedereen die Jani tegenkwam

De ongrammaticaliteit van deze zin zouden we kunnen verklaren wanneer we aannemen dat 'm de non-anafoor Jan c-commandeert. Principe C van de bindingstheorie zegt dat een non-anafoor, zoals een naam, nooit gecoïndexeerd mag zijn met een c-commanderende categorie.

De argumentatie aangaande vrije anaforen zou ervoor kunnen pleiten om het voorzetselvoorwerp te beschouwen als een NP met een geadjungeerde prepositie en dus niet als een gewone PP.

Er zijn nog enkele nadelen verbonden aan de P+[NP]-analyse voor het voorzetselvoorwerp:

Een probleem is dat PP-over-V wel toepasbaar is op het voorzetselvoorwerp. Deze verplaatsingsregel kan echter ook (later in de grammatica) van toepassing zijn op oppervlakte-PP's, waaronder ook P+DO. Dit zou dan een vorm van heranalyse zijn, waar een NP met een geadjungeerde P beschouwd wordt als een PP. Na deze heranalyse is het mogelijk dat er van de oppervlakte-PP een voornaamwoordelijk bijwoord gemaakt wordt.

Als we de syntactische functie DO loskoppelen van de categorie, dan kunnen we met zekerheid zeggen dat het VZV een DO is. Daar bestaat geen twijfel over. Het VZV is namelijk gewoon een soort LV, maar dan met een voorzetsel. Het voorzetsel voegt hoegenaamd niets aan de betekenis toe.

Het traditionele onderscheid tussen direct object (DO) en prepositioneel object (PO) kan dus komen te vervallen. Een PO is eigenlijk een DO met een geadjungeerde prepositie. Het onderscheid tussen DO en PO is niet gebaseerd op functionele maar op categoriale verschillen. Door met IA te werken nemen we de groep van Objecten samen. Als het IA in de vorm van een NP geen casus kan ontvangen, dan bestaat voor het IA nog de mogelijkheid om als PP gerealiseerd te worden waarbij het voorzetsel dan de casus uitdeelt aan die NP. Zo wordt via het voorzetsel van de PP ontsnapt aan het Casusfilter. De P van een prepositioneel object heeft dezelfde functie. Dit vaste voorzetsel wordt geselecteerd door het werkwoord zelf. Het is een soort dummy-voorzetsel, een betekenisloos voorzetsel dat het NP-object naamval verschaft.

Hierboven hebben we gezien dat we de traditionele functie voorzetselvoorwerp (of 'prepositioneel object') beter als lijdend voorwerp kunnen behandelen. Hier volstaat het type IA. Bij argumenten EA en IA hoeven we geen verdere onderverdeling in verschillende soorten aan te houden zoals dat wel gebeurt bij grammaticale functies. We abstraheren dan over de verschillende functies. Als de labels SU/IO/DO gebruikt worden, dan duidt dat erop dat het drie argumenten zijn die naast elkaar functioneren. Bij het gebruik van de labels EA/IA wordt duidelijk gemaakt dat er maar twee soorten argumenten zijn. Er wordt gesteld dat IO en DO (allebei IA) meer met elkaar gemeen hebben dan IO/DO met SU (dat is de enige EA). De gemeenschappelijkheid tussen IO en DO komt tot uitdrukking in het gebruik van IA. Deze generalisatie missen we dus bij het gebruik van grammaticale functies.

Als het onderscheid tussen de verschillende syntactische functies geen grond lijkt te hebben, dan is het beter om het algemenere abstracte type EA/IA te gebruiken. De (traditioneel) gemaakte onderscheidingen in grammaticale functies vinden zowel syntactische als semantische gronden. We willen echter de lexicale informatie scheiden van de structurele. De grammaticale functies zijn uiteindelijk af te leiden uit de structuur en die willen we dus niet in het S-frame opnemen. Dit zou immers leiden tot redundantie.

Door semantische rollen toe te kennen aan argumenten, maken we de semantische onderscheidingen expliciet, terwijl die onderscheidingen bij het gebruik van grammaticale functies eerder impliciet bleven. Bovendien worden de syntactische argumenten uniek gemaakt door toekenning van unieke thematische rollen. We kunnen nu verwijzen naar specifieke argumenten, zodat een vaste volgorde van argumenten in een S-frame in principe losgelaten kan worden. Dit ondersteunt het uitgangspunt dat de structurele positie van de argumenten niet in het S-frame moet worden vastgelegd maar moet volgen uit algemene regels of principes (zie paragraaf \ref{paragraaf-afleidbaarheid}). Die principes bepalen immers de structurele configuratie. Daarbij blijft ieder argument uniek in de syntactische structuur, doordat ieder argument verbonden is met een unieke thetarol.

Enerzijds kunnen we het toevoegen van semantische informatie zien als een verdere invulling van de aard van argumenten, anderzijds kunnen we abstraheren van de gemaakte onderscheidingen door alleen het overkoepelende type, namelijk de argumenten, in ogenschouw te nemen.

We moeten concluderen dat het gebruik van EA en IA in het S-frame zeer aantrekkelijk is als we subcategorisatie op het eerste niveau willen beschrijven. Bovendien wordt de structuur van de S-frames, in termen van EA en IA, een stuk uniformer.

In de volgende paragraaf zal ik motiveren dat deze argumenten nader gespecificeerd moeten worden om een adequate beschrijving van subcategorisatie te kunnen geven.

Vervolg: Categorieselectie



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025