Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

Inleiding

In deze doctoraalscriptie zal worden onderzocht wat de aard en het domein is van de taalkundige notie SUBCATEGORISATIE en - als aanvulling hierop - hoe subcategorisatie in een natuurlijke-taalverwerkend systeem opgenomen dient te worden. De doelstelling is om uit te zoeken wat subcategorisatie precies inhoudt in termen van subcategorisatie-eisen opgelegd door het werkwoord. In de implementatie zal duidelijk worden hoe deze subcategorisatie-eisen gecontroleerd worden.

In de generatieve grammatica wordt meestal meer een schetsmatige beschrijving gegeven van wat subcategorisatie is. Een werkwoord subcategoriseert voor een aantal elementen, bijvoorbeeld een subject en/of een direct object eventueel in combinatie met een indirect object. Deze gesubcategoriseerde elementen worden ondergebracht in een subcategorisatieframe van het betreffende werkwoord. Aan deze syntactische eisen moet voldaan worden in de structuur, wil die structuur grammaticaal zijn. Verder wordt op deze kwestie niet ingegaan. Het lijkt erop dat het onderwerp subcategorisatie meer in de schaduw is komen te staan, terwijl het toch de basis vormt voor syntactische structuren.

Binnen het kader van wat subcategorisatie precies inhoudt en wat nog binnen het bereik van subcategorisatie valt, zijn veel aspecten nog onduidelijk. Er zijn op dit gebied nog veel vragen te beantwoorden.

De vraag is allereerst of alle werkwoorden subcategoriseren voor elementen. Veelal worden zelfstandige werkwoorden gebruikt om subcategorisatie te illustreren. Het is onduidelijk of hulpwerkwoorden ook subcategoriseren voor elementen. En ook als zou blijken dat er ook subcategorisatieframes bestaan voor hulpwerkwoorden, dan is het nog de vraag of de gesubcategoriseerde elementen van hulpwerkwoorden vergelijkbaar zijn met die van zelfstandige werkwoorden. Er kan een verschil zijn in het type van gesubcategoriseerde elementen. De concretere vraag is dan hoe de subcategorisatieframes er voor verschillende werkwoorden uitzien.

Als we willen weten welke informatie deze subcategorisatieframes moeten bevatten, dan zullen we moeten onderzoeken welke vorm en welk type de gesubcategoriseerde elementen aannemen. Hier moet gedacht worden aan syntactische categorieën en grammaticale functies of syntactische argumenten. Ik zal aannemelijk proberen te maken dat subcategorisatie in beginsel de syntactische selectie van argumenten omvat. Daarbij is de categoriale invulling van deze argumenten onontbeerlijk. We zullen zien dat een benadering waarin semantische rollen (of algemener: thematische rollen) worden ingepast, enige voordelen heeft, waardoor het belang van grammaticale functies sterk afneemt.

Wat nog onder subcategorisatie valt en hoe dat dan opgenomen moet worden in een subcategorisatieframe, is een vraag die we terug zullen zien komen bij de behandeling van de volgende onderdelen:

Bij subcategorisatie speelt het lexicon een grote rol. Daar worden de subcategorisatieframes beschreven. De algemene vraag is wat wel en wat niet thuishoort in een lexicon. Dit is afhankelijk van de benadering die wordt gekozen. Ik kies hier voor een meer structurele benadering, waar gestreefd wordt naar generalisaties aangaande structurele eigenschappen. Het lexicon is in deze benadering de plaats waar alleen toevallige en niet-structurele eigenschappen worden opgenomen. We willen geen generalisaties missen, dus we zullen geen structuren in het lexicon stipuleren die af te leiden zijn uit algemene principes of kenmerken. De vraag is dus of we alle eigenschappen en structuren moeten opnemen in het lexicon in de vorm van subcategorisatieframes. Omdat hier voor een generaliserende aanpak wordt gekozen waarin opsomming zo veel mogelijk wordt vermeden, worden structurele eigenschappen niet in het lexicon opgenomen. In dit verband worden de volgende punten bekeken:

Naarmate meer onderdelen bekeken zijn, zal de aard en het domein van subcategorisatie steeds specifieker worden. Het onderzoek zal leiden tot een soort afbakening van wat subcategorisatie nu precies is en hoe we dit eenduidig beschrijven in subcategorisatieframes.

In dit onderzoek wordt grotendeels het Government & Binding-kader aangenomen. Het is verstandig om ook andere taaltheoretische kaders in beschouwing te nemen en te kijken wat daar onder subcategorisatie wordt verstaan en hoe subcategorisatie opgenomen wordt. Naast Government & Binding (GB) worden de kaders Lexical Functional Grammar (LFG) en Head-driven Phrase Structure Grammar (HPSG) besproken met betrekking tot de hoofdkenmerken van het kader en de verwerking van subcategorisatie daarbinnen.

Er bestaan al linguïstische modellen waarin subcategorisatie min of meer is opgenomen. Deze modellen zal ik kort bespreken. Uiteindelijk zal ik laten zien hoe subcategorisatie, met de gevonden bevindingen daarbij, in een implementatie op een linguïstisch verantwoorde wijze verwerkt zou moeten worden.

De opzet van deze doctoraalscriptie is als volgt. In het eerste hoofdstuk, dat de theoretische basis vormt voor de rest van het werk, wordt de aard en het domein van subcategorisatie onderzocht. Het tweede hoofdstuk bespreekt drie taaltheoretische kaders en dan in het bijzonder hoe subcategorisatie in ieder kader verwerkt is. Bestaande linguïstische modellen waarin subcategorisatie is opgenomen, worden bekeken in hoofdstuk 3. Ten slotte zal ik in hoofdstuk 4 mijn nieuwe implementatie, SUBCATSY genaamd, die gebaseerd is op de bevindingen in de voorafgaande hoofdstukken, toelichten.



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025