Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

De aard en het domein van subcategorisatie

Aanvankelijk werd subcategorisatie in generatieve taalkundige theorieën, zoals de standaardtheorie [Chomsky, 1965], ruim gezien. Het was het verschijnsel dat door subcategorisatieregels teweeg werd gebracht. Deze subcategorisatieregels, in ruime zin, kunnen als volgt omschreven worden [Booij et al., 1975]:

Subcategorisatieregels
“Regels die lexicale categorieën subcategoriseren. Er bestaan twee typen in de standaardtheorie: inherente en contextgevoelige subcategorisatieregels. De eerste ontwikkelen bijvoorbeeld het nomen tot [+CONCREET], [+BEZIELD], [+MENSELIJK], etc., d.w.z. tot inherente kenmerken. Deze maken deel uit van het complex symbool dat geassocieerd is met de desbetreffende lexicale categorie. Contextgevoelige subcategorisatieregels zijn te verdelen in strikte subcategorisatieregels en selectieregels.”
[G.E. Booij, J.G. Kerstens and H.J. Verkuyl (1975), Lexicon van de taalwetenschap]

Subcategorisatie kan beschreven worden met de genoemde contextgevoelige subcategorisatieregels. Meestal beperkt men zich dan tot de strikte subcategorisatieregels. Deze strikte subcategorisatieregels zijn goed te vergelijken met zogenaamde insertieregels, die een zekere categorie zoals het werkwoord in een bepaalde syntactische omgeving of context plaatsen. De volgende definitie in termen van strikte subcategorisatieregels (Booij et al. 1975) vormt de basis voor een concretere specificering van het begrip subcategorisatie:

(1) Strikte subcategorisatieregels
“Regels die er voor zorgen dat lexicale items worden geïntroduceerd in de voor hun passende syntactische omgeving. Het domein van strikte subcategorisatieregels is in de standaardtheorie beperkt tot de VC [= Verbale Constituent, SvD]. De regels subcategoriseren de categorie V met betrekking tot de mogelijke zusterknopen van V. Zo zijn er werkwoorden die geen (lijdend voorwerps-)NC [= Nominale Constituent, SvD] als zusterconstituent nemen (intransitieve werkwoorden), werkwoorden met een vast voorzetselcomplement, werkwoorden met richtingsbepalingen, etc.
In het lexicon staat deze informatie voor elk werkwoord in zijn lemma vermeld. Op grond van bijvoorbeeld de informatie [+ ___ NC] vermeld in een lemma van een werkwoord als verorberen, kan dit werkwoord alleen worden geïntroduceerd in een structuur waarin een NC als zusterconstituent van V optreedt. Verdere differentiatie van de categorie V vindt plaats via selectieregels.”
[G.E. Booij, J.G. Kerstens and H.J. Verkuyl (1975), Lexicon van de taalwetenschap]

Laat ik eerst, voordat we verder gaan, het domein van subcategorisatie beperken. Subcategorisatie zou op basis van ieder lexicaal hoofd verwezenlijkt kunnen worden. Dit onderzoek zal zich alleen richten op de werkwoord-subcategorisatie: subcategorisatie door verbale kernen. De subcategorisatie van andere kernen, zoals bijvoeglijke naamwoorden (adjectieven), zelfstandige naamwoorden (nomina) en voorzetsels (preposities), wordt buiten beschouwing gelaten. Uit definitie (1) blijkt al dat subcategorisatie in het algemeen op dezelfde manier wordt ingeperkt.

In definitie (1) wordt subcategorisatie voorgesteld als de omgevingen waarin het werkwoord kan voorkomen. Hier wordt dus het werkwoord in de passende context geplaatst. Het aantal mogelijke omgevingen voor dit werkwoord wordt ingeperkt door subcategorisatieregels.

Het werkwoord kunnen we het beste zien als kern waarbij de syntactisch geselecteerde elementen de afhankelijkheden zijn. We moeten in deze zienswijze subcategorisatie van werkwoorden beschouwen als het selecteren van een vast aantal elementen. Hoeveel en welke elementen worden gekozen, hangt steeds af van het hoofdwerkwoord (de kern).

Verder mogen in de definitie van strikte subcategorisatie (1) de categorieën die het werkwoord V bij zich heeft, alleen zusterconstituenten van V zijn. Dit betekent dat enkel voor objecten gesubcategoriseerd kan worden. De vraag is of het subject ook niet valt onder subcategorisatie en opgenomen moet worden als een gesubcategoriseerd element van het werkwoord. De huidige definitie van subcategorisatie zou dan eventueel aangepast moeten worden.

Als we aannemen dat een werkwoord zekere elementen neemt, dan is nog niet duidelijk welke vorm deze elementen aannemen. Zijn het de gebruikelijke syntactische categorieën, zoals NP, PP, VP, of de grammaticale functies, zoals het subject en het direct, indirect of prepositioneel object, of zijn het juist syntactische argumenten (cf. argumentposities)? Het kan ook zijn dat werkwoorden voor combinaties van deze soorten, bijvoorbeeld categorieën met syntactische functies of argumenten, subcategoriseren. Hier speelt dus de vraag wat de meest geschikte (sub)typering is van de gesubcategoriseerde elementen (zie paragraaf 1.1 Typering van gesubcategoriseerde elementen).

Hieronder wil ik eerst aan de hand van zeer eenvoudige zinnen de subcategorisatie-eisen van enkele typerende zelfstandige werkwoorden illustreren, namelijk van een intransitief, monotransitief en een ditransitief werkwoord. Voor alle duidelijkheid geef ik de betekenis van de gehanteerde markering voor de grammaticaliteitsoordelen bij zinnen: een asterisk (*) vóór een voorbeeld duidt op een ongrammaticale zin of woordgroep, een vraagteken (?) ervoor drukt twijfel uit -- de structuur hoeft echter niet syntactisch ongrammaticaal te zijn, terwijl een combinatie van asterisk en vraagteken onduidelijkheid betekent en aangeeft dat er niet echt sprake is van een syntactisch grammaticale zin, en ten slotte het procentteken (%) dat staat voor: semantisch of pragmatisch onacceptabel.

(2)a. Jan lacht
b. *Jan lacht Marie
c. *Jan lacht Marie een bos bloemen
(3)a. *Jan ziet
b. Jan ziet Marie
c. *Jan ziet Marie een bos bloemen
(4)a. *Jan geeft
b. *Jan geeft Marie
c. Jan geeft () een bos bloemen
d. Jan geeft Marie een bos bloemen

In (3)-(5) zijn enkele werkwoorden gegeven die telkens weer in een andere syntactische omgeving staan. Deze werkwoorden hebben ten opzichte van elkaar verschillende Subcategorisatie-frames. (Een andere term voor subcategorisatieframe is `subcategorisatieschema'.)

Het subject van lachen wordt gerealiseerd door de categorie NP. Het werkwoord lachen is intransitief. Dit houdt in dat het niet subcategoriseert voor NP-objecten. Worden de subcategorisatie-eisen geschonden, dan ontstaat ongrammaticaliteit. Dit is te zien bij de gevallen waar een objects-NP bij het intransitieve werkwoord staat.

We krijgen een ander beeld als we kiezen voor het monotransitieve werkwoord zien dat naast een subject een direct object verwacht. Als de objects-NP hier wordt weggelaten, wordt de zin ongrammaticaal. Het object is in het subcategorisatieframe gemarkeerd als verplicht en moet dus in de structuur aanwezig zijn. Er zijn ook (pseudo-)transitieve werkwoorden waar het object optioneel is. Bij deze werkwoorden kan het object achterwege blijven in de structuur. Als echter in de omgeving van het monotransitieve werkwoord twee objecten voorkomen, levert dit altijd ongrammaticaliteit op. De eis van het aantal argumenten dat het werkwoord (maximaal) kan nemen, is dan geschonden. Deze transitieve werkwoorden nemen immers maximaal één argument.

Het ditransitieve werkwoord geven kan naast een direct object een indirect object hebben. Dit werkwoord neemt dus een subject, een indirect en een direct object. Als bijvoorbeeld alleen het subject of alleen het indirect object aanwezig is, dan worden de subcategorisatie-eisen geschonden. Het indirect object bij ditransitieve werkwoorden is meestal optioneel en hoeft dus niet in de oppervlaktestructuur voor te komen.

Hier kunnen we concluderen dat ieder werkwoord syntactische eisen oplegt aan de structuur. Zo worden bepaalde grammaticale elementen wel of niet verlangd. Als bepaalde subcategorisatie-eisen van een werkwoord, zoals het aantal en het type argumenten, geschonden worden, dan ontstaat ongrammaticaliteit. Subcategorisatie drukt dan de syntactische beperkingen uit op het aantal en het soort argumenten in relatie tot het werkwoord. Dit wordt uitgedrukt in een Subcategorisatie-frame (voortaan: S-frame).

De principiële vraag die in deze doctoraalscriptie aan de orde gesteld wordt, is: wat houdt subcategorisatie precies in? We weten dat het een vorm is van syntactische selectie. Het gaat dus niet om semantische features, want dat zijn selectierestricties, die eerder afhankelijk zijn van de buiten-talige werkelijkheid. Het kan goed zijn dat het ook niet direct om categorieën gaat, maar juist om syntactische argumenten. Dat zou betekenen dat er drie niveaus van selectie kunnen zijn:

(5)   (A) Welke syntactische argumenten selecteert het werkwoord?
  (B) Welke categorieën hebben deze argumenten?
  (C) Welke verdere restricties zijn daar verder nog op van toepassing?

Vraag (A) en (B) is wat we tot nu toe subcategorisatie hebben genoemd. In wezen gaat het hier om het type van de direct door het werkwoord gesubcategoriseerde elementen. De precieze (sub)typering van deze gesubcategoriseerde elementen zal in de volgende paragraaf onderzocht worden.

Vervolg: Typering van gesubcategoriseerde elementen



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025