Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

S-frames in het lexicon

Het is van belang te weten hoe de S-frames zijn gestructureerd in het lexicon. We moeten weten welke informatie is opgenomen en welke kan worden afgeleid. Wat afgehandeld kan worden door de grammatica via afleidingen, generalisaties en principes, wordt niet opgenomen in het lexicon (zie paragraaf Afleidbaarheid). We willen zo min mogelijk in het lexicon vastleggen. Alleen de toevallige en niet-structurele eigenschappen staan in het lexicon.

De S-frames vormen de kern van de relatie tussen het lexicon en de grammatica die de syntactische structuur oplevert. In het S-frame staan de subcategorisatie-eisen. De algemene datastructuur van een S-frame ziet er als volgt uit:

In dit geval is in het lexicon alleen de werkwoord-subcategorisatie opgenomen. De waarde van CAT in dit S-frame is dan ook steeds 'V': categorie = Verbum. De SUBCAT-lijst wordt opgehaald met behulp van de basisvorm of stamvorm van het werkwoord (STEM).

Elke keer wordt de basisvorm van een bepaalde werkwoordsvorm bepaald. Het S-frame wordt alleen bij deze basisvorm vermeld. Nu hoeft niet bij iedere verbuigingsvorm van een bepaald werkwoord steeds hetzelfde S-frame in het lexicon opgenomen te worden. Redundantie wordt op die manier voorkomen. Bovendien wordt hiermee tot uitdrukking gebracht dat het S-frame onafhankelijk is van de verbuigingsvorm van een werkwoord.}

De S-frames zijn verder gemarkeerd voor bepaalde features zoals passiviseerbaarheid, ergativiseerbaarheid, reflexiviseerbaarheid en de mogelijkheid tot Raising-To-Subject (RTS).

We hebben twee soorten S-frames: basis-S-frames en afgeleide S-frames. De concrete basis-S-frames kunnen we onderverdelen in:

  1. koppelwerkwoorden
  2. hulpwerkwoorden
  3. zelfstandige werkwoorden

Zelfstandige werkwoorden subcategoriseren voor argumenten. De groep van zelfstandige werkwoorden kent een verdere onderverdeling. Meestal wordt dan de volgende subclassificatie gegeven: intransitieve en transitieve (monotransitieve en ditransitieve) werkwoorden. In mijn implementatie heb ik gekozen voor een verfijndere onderverdeling. In S-frames is niet alleen het aantal argumenten dat het werkwoord selecteert weergegeven, maar ook de aard van die argumenten in termen van categorieselectie (met eventuele prepositieselectie), aangevuld met de passende thematische rol en andere semantische features.

Bij niet-zelfstandige werkwoorden is geen sprake van subcategorisatie in termen van (interne) argumenten. Op de predikaatspositie (pred) bij het koppelwerkwoorden kan vrijwel iedere categorie staan. Er is dan ook geen sprake van categorieselectie (CAT=XP). Hulpwerkwoorden nemen steeds een verbale categorie (CAT=VP) als complement. Ze zijn te beschouwen als VP-selecteerders.

Hier een overzicht van de basis-S-frames:

  1. koppelwerkwoorden:
    sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), pred(XP,ROLE2,SEM_FEAT2)])

  2. hulpwerkwoorden:
    sframes(v,STEM, [ea(X,Y,Z), vpred(vp(VFORM))]).

  3. zelfstandige werkwoorden:

    • INTRANSITIEF:
      sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1)]).

    • MONOTRANSITIEF:
      sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ia(CAT2,ROLE2,SEM_FEAT2)]).

    • DITRANSITIEF:
      sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ia(CAT2,ROLE2,SEM_FEAT2), ia(CAT3,ROLE3,SEM_FEAT3)]).

    • met ADJUNCT-ARGUMENTEN:
      sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ad(CAT2,ROLE2,SEM_FEAT2)]).

Er zijn ook S-frames die we kunnen afleiden van basis-S-frames. We krijgen dan afgeleide S-frames die nodig zijn om bijvoorbeeld de passief- of ergatiefvariant te krijgen. In dat geval wordt het betreffende basis-S-frame herordend. De mogelijkheden hiertoe worden steeds bij het basis-S-frame aangegeven met een markering.

Afgeleide S-frames:

De volgende markeringen zijn mogelijk bij de basis-S-frames van de zelfstandige werkwoorden:

  passiv(+/–) : passiviseerbaarheid;
  ergativ(+/–opt) : evt. ergativisatie;
  ergativ_refl(+/–opt) : evt. ergativisatie met ergatiefspoor (refl. pronomen);
  rts(+opt) : evt. raising-to-subject

Via de lexicale regel 'Passivisatie' (meer passivisatie-regels in DCG) worden de argumenten herordend. Er ontstaat een nieuw afgeleid S-frame gemarkeerd met [+PASS] (= passive). Met dit afgeleide S-frame wordt de syntactische structuur van het passief opgebouwd. Een van de interne argumenten komt op de EA-positie, terwijl het oorspronkelijke EA in de vorm van een door-bepaling kan worden weergegeven in de passiefconstructie. Schematisch kan dit als volgt worden weergegeven:

  [ea(NP1) ... ia(NP2,OCCURR) ...] => [ea(NP2) ... ia(door+NP1,opt)].

Een voorbeeld van een afgeleid S-frame met de passiefvariant is:

sframe(v,STEM,[ea(np,ROLE2,SEM_FEAT2),ia(p(door),ROLE1,SEM_FEAT1,opt)],pass) :-
   sframe(v,STEM, [ea(np,ROLE1,SEM_FEAT1),ia(CAT2,ROLE2,SEM_FEAT2,OCCURR2)], passiv).

De lexicale regel 'Ergativisatie' lijkt veel op passivisatie. Bij ergativisatie komt het oorspronkelijk interne argument op de EA-positie. Als een werkwoord daarbij is gemarkeerd met [+refl], dan wordt op de extractieplaats een ergatiefspoor achtergelaten in de vorm van een reflexief pronomen. Door ergativisatie wordt dus een nieuw afgeleid S-frame opgeleverd. De grammatica maakt verder gebruikt van dit afgeleide S-frame. Twee voorbeelden van afgeleide S-frames voor de ergatiefvariant zijn:

%[+ergat,-refl]
sframe(v,STEM,
[ea(CAT,ROLE,SEM_FEAT)|Rest]) :-
   sframe(v,STEM,[EA,ia(CAT,ROLE,SEM_FEAT,OCCURR)|Rest], ergat(OPT)).

%[+ergat,+refl]:
sframe(v,STEM,
[ea(np,ROLE,SEM_FEAT),ia(np(refl(no_opt)),no_role,SEM_FEAT,no_opt)|Rest]) :-
   sframe(v,STEM,[EA,ia(CAT,ROLE,SEM_FEAT,OCCURR)|Rest], ergat_refl(OPT)).

In het eerste geval wordt er geen ergatiefspoor achtergelaten op de IA-positie. In het tweede geval wordt er wel een ergatiefspoor achtergelaten. De invulling van de variabele OPT bij de markering 'ergat' bepaalt of ergativisatie verplicht (no_opt) of optioneel (opt) is. In het eerste geval wordt er bij het betreffende werkwoord altijd een S-frame afgeleid waarin alleen de structuur met ergativatie mogelijk is. In het tweede geval is ergativisatie een mogelijkheid bij het werkwoord: een ergatiefvariant naast de niet-ergatieve (of causatieve) variant. Deze ergatiefvariant wordt steeds afgeleid van het basis-S-frame met de markering 'ergat' of 'ergat_refl'.

Indien er sprake is van verplichte ergativisatie bij een bepaald werkwoord, dan is passivisatie bij datzelfde werkwoord uitgesloten. Deze generalisatie zouden we missen als we de stap van ergativisatie overslaan en het afgeleide S-frame direct zouden uitschrijven als basis-S-frame met daarbij de specificatie van wel of niet passiviseerbaar [+/–passiv]. Bij 'ergat(no_opt)', verplichte ergativisatie, geldt altijd: [–passiv]. Het feature [passiv] hoeft dan niet extra gespecificeerd te worden.

De variant met Raising To Subject (RTS) is op dezelfde manier uitgewerkt als de varianten passivisatie en ergativisatie. Ook hier wordt een afgeleid S-frame opgeleverd. Dit kan alleen van toepassing zijn op basis-S-frames die gemarkeerd zijn met RTS.

%[+rts]
sframe(v,STEM,[ea(CAT,ROLE,SEM_FEAT),vpred(te_inf)]) :-
   sframe(v,STEM,
   [ea(np(het),no_role,no_feat),ia(np,dative,ani,opt),
    ia(c(dat),object,no_ani,no_opt)],
   rts(opt)).

Bij dit werkwoord is RTS optioneel. Bij RTS is er sprake van infinitief met te waar de oorspronkelijk thetaloze EA-positie wordt bezet door een argument dat zijn rol niet heeft gekregen van het RTS-werkwoord maar van het zelfstandige hoofdwerkwoord.

We zien dat met een markering bij het werkwoord, zoals [±PASS], [±ERGAT, ±REFL] en [±RTS], de varianten – optioneel of verplicht – afgeleid kunnen worden van het basis-S-frame. Voor de precieze en volledige uitwerkingen hiervan verwijs ik naar het S-FRAME-lexicon van mijn DCG-implementatie (Bijlage B).



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025