Het is van belang te weten hoe de S-frames zijn gestructureerd in het
lexicon.
We moeten weten welke informatie is opgenomen en welke kan worden
afgeleid.
Wat afgehandeld kan worden door de grammatica via afleidingen,
generalisaties en principes, wordt niet opgenomen in het lexicon
(zie paragraaf Afleidbaarheid).
We willen zo min mogelijk in het lexicon vastleggen. Alleen de toevallige
en niet-structurele eigenschappen staan in het lexicon.
De S-frames vormen de kern van de relatie tussen het lexicon en de
grammatica die de syntactische structuur oplevert. In het S-frame staan
de subcategorisatie-eisen.
De algemene datastructuur van een S-frame ziet er als volgt uit:
- sframe(CAT, STEM, [SUBCAT], Marking).
In dit geval is in het lexicon alleen de werkwoord-subcategorisatie
opgenomen. De waarde van CAT in dit S-frame is dan ook steeds 'V':
categorie = Verbum.
De SUBCAT-lijst wordt opgehaald met behulp van de basisvorm of stamvorm van
het werkwoord (STEM).
Elke keer wordt de basisvorm van een bepaalde werkwoordsvorm
bepaald. Het S-frame wordt alleen bij deze basisvorm vermeld.
Nu hoeft niet bij iedere verbuigingsvorm van een bepaald werkwoord steeds
hetzelfde S-frame in het lexicon opgenomen te worden.
Redundantie wordt op die manier voorkomen.
Bovendien wordt hiermee tot uitdrukking gebracht dat het S-frame
onafhankelijk is van de verbuigingsvorm van een werkwoord.}
De S-frames zijn verder gemarkeerd voor bepaalde features
zoals
passiviseerbaarheid,
ergativiseerbaarheid,
reflexiviseerbaarheid
en de mogelijkheid tot
Raising-To-Subject (RTS).
We hebben twee soorten S-frames: basis-S-frames en afgeleide S-frames.
De concrete basis-S-frames kunnen we onderverdelen in:
- koppelwerkwoorden
- hulpwerkwoorden
- zelfstandige werkwoorden
Zelfstandige werkwoorden subcategoriseren voor argumenten.
De groep van zelfstandige werkwoorden kent een verdere onderverdeling.
Meestal wordt dan de volgende subclassificatie gegeven:
intransitieve en transitieve (monotransitieve en ditransitieve)
werkwoorden. In mijn implementatie heb ik gekozen voor een verfijndere
onderverdeling. In S-frames is niet alleen het aantal argumenten dat
het werkwoord selecteert weergegeven, maar ook de aard van die argumenten
in termen van categorieselectie (met eventuele prepositieselectie),
aangevuld met de passende thematische rol en andere semantische features.
Bij niet-zelfstandige werkwoorden is geen sprake van subcategorisatie
in termen van (interne) argumenten. Op de predikaatspositie (pred) bij
het koppelwerkwoorden kan vrijwel iedere categorie staan.
Er is dan ook geen sprake van categorieselectie (CAT=XP).
Hulpwerkwoorden nemen steeds een verbale categorie (CAT=VP)
als complement. Ze zijn te beschouwen als VP-selecteerders.
Hier een overzicht van de basis-S-frames:
- koppelwerkwoorden:
sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), pred(XP,ROLE2,SEM_FEAT2)])
- hulpwerkwoorden:
sframes(v,STEM, [ea(X,Y,Z), vpred(vp(VFORM))]).
- zelfstandige werkwoorden:
- INTRANSITIEF:
sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1)]).
- MONOTRANSITIEF:
sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ia(CAT2,ROLE2,SEM_FEAT2)]).
- DITRANSITIEF:
sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ia(CAT2,ROLE2,SEM_FEAT2), ia(CAT3,ROLE3,SEM_FEAT3)]).
- met ADJUNCT-ARGUMENTEN:
sframe(v,STEM, [ea(CAT1,ROLE1,SEM_FEAT1), ad(CAT2,ROLE2,SEM_FEAT2)]).
Er zijn ook S-frames die we kunnen afleiden van basis-S-frames.
We krijgen dan afgeleide S-frames die nodig zijn om
bijvoorbeeld de passief- of ergatiefvariant te krijgen.
In dat geval wordt het betreffende basis-S-frame herordend.
De mogelijkheden hiertoe worden steeds bij het basis-S-frame aangegeven
met een markering.
Afgeleide S-frames:
- passief
- ergatief, reflexief;
ergatiefspoor-analyse (reflexief pronomen als ergatiefspoor)
- raising to subject (rts)
De volgende markeringen zijn mogelijk bij de basis-S-frames van de
zelfstandige werkwoorden:
| | passiv(+/) | : passiviseerbaarheid;
|
| | ergativ(+/opt) | : evt. ergativisatie;
|
| | ergativ_refl(+/opt) | : evt. ergativisatie met ergatiefspoor (refl. pronomen);
|
| | rts(+opt) | : evt. raising-to-subject
|
Via de lexicale regel 'Passivisatie' (meer passivisatie-regels in DCG)
worden de argumenten herordend. Er ontstaat een nieuw afgeleid S-frame
gemarkeerd met [+PASS] (= passive).
Met dit afgeleide S-frame
wordt de syntactische structuur van het passief opgebouwd.
Een van de interne argumenten komt op de EA-positie, terwijl het
oorspronkelijke EA in de vorm van een door-bepaling kan worden
weergegeven in de passiefconstructie.
Schematisch kan dit als volgt worden weergegeven:
| | [ea(NP1) ... ia(NP2,OCCURR) ...] => [ea(NP2) ... ia(door+NP1,opt)].
|
Een voorbeeld van een afgeleid S-frame met de passiefvariant is:
sframe(v,STEM,[ea(np,ROLE2,SEM_FEAT2),ia(p(door),ROLE1,SEM_FEAT1,opt)],pass) :-
sframe(v,STEM, [ea(np,ROLE1,SEM_FEAT1),ia(CAT2,ROLE2,SEM_FEAT2,OCCURR2)], passiv).
De lexicale regel 'Ergativisatie' lijkt veel op passivisatie.
Bij ergativisatie komt het oorspronkelijk interne argument op de EA-positie.
Als een werkwoord daarbij is gemarkeerd met [+refl], dan wordt op de
extractieplaats een ergatiefspoor achtergelaten in de vorm van een
reflexief pronomen.
Door ergativisatie wordt dus een nieuw afgeleid S-frame opgeleverd.
De grammatica maakt verder gebruikt van dit afgeleide S-frame.
Twee voorbeelden van afgeleide S-frames voor de ergatiefvariant
zijn:
%[+ergat,-refl]
sframe(v,STEM,
[ea(CAT,ROLE,SEM_FEAT)|Rest]) :-
sframe(v,STEM,[EA,ia(CAT,ROLE,SEM_FEAT,OCCURR)|Rest], ergat(OPT)).
%[+ergat,+refl]:
sframe(v,STEM,
[ea(np,ROLE,SEM_FEAT),ia(np(refl(no_opt)),no_role,SEM_FEAT,no_opt)|Rest]) :-
sframe(v,STEM,[EA,ia(CAT,ROLE,SEM_FEAT,OCCURR)|Rest], ergat_refl(OPT)).
In het eerste geval wordt er geen ergatiefspoor achtergelaten op de
IA-positie. In het tweede geval wordt er wel een ergatiefspoor achtergelaten.
De invulling van de variabele OPT bij de markering 'ergat' bepaalt of
ergativisatie verplicht (no_opt) of optioneel (opt) is.
In het eerste geval wordt er bij het betreffende werkwoord altijd een
S-frame afgeleid waarin alleen de structuur met ergativatie mogelijk is.
In het tweede geval is ergativisatie een mogelijkheid bij het werkwoord:
een ergatiefvariant naast de niet-ergatieve (of causatieve) variant.
Deze ergatiefvariant wordt steeds afgeleid van het basis-S-frame met
de markering 'ergat' of 'ergat_refl'.
Indien er sprake is van verplichte ergativisatie bij een bepaald werkwoord,
dan is passivisatie bij datzelfde werkwoord uitgesloten. Deze generalisatie
zouden we missen als we de stap van ergativisatie overslaan en het
afgeleide S-frame direct zouden uitschrijven als basis-S-frame met daarbij
de specificatie van wel of niet passiviseerbaar [+/passiv].
Bij 'ergat(no_opt)', verplichte ergativisatie, geldt altijd: [passiv].
Het feature [passiv] hoeft dan niet extra gespecificeerd te worden.
De variant met Raising To Subject (RTS) is op dezelfde manier
uitgewerkt als de varianten passivisatie en ergativisatie.
Ook hier wordt een afgeleid S-frame opgeleverd.
Dit kan alleen van toepassing zijn op basis-S-frames die gemarkeerd zijn
met RTS.
%[+rts]
sframe(v,STEM,[ea(CAT,ROLE,SEM_FEAT),vpred(te_inf)]) :-
sframe(v,STEM,
[ea(np(het),no_role,no_feat),ia(np,dative,ani,opt),
ia(c(dat),object,no_ani,no_opt)],
rts(opt)).
Bij dit werkwoord is RTS optioneel. Bij RTS is er sprake van
infinitief met te waar de oorspronkelijk thetaloze EA-positie
wordt bezet door een argument dat zijn rol niet heeft gekregen van het
RTS-werkwoord maar van het zelfstandige hoofdwerkwoord.
We zien dat met een markering bij het werkwoord,
zoals [±PASS], [±ERGAT,
±REFL] en [±RTS],
de varianten optioneel of verplicht afgeleid kunnen worden
van het basis-S-frame.
Voor de precieze en volledige uitwerkingen hiervan verwijs ik naar het
S-FRAME-lexicon van mijn DCG-implementatie
(Bijlage B).