Doctoraalscriptie (1996)
K.U. Nijmegen


Subcategorisatie
Een onderzoek naar SUBCATEGORISATIE en de verwerking ervan in een NLP-systeem.

Simon van Dreumel

EUROTRA

Inleiding

EUROTRA is een vertaalsysteem dat negen talen omvat: Engels, Frans, Spaans, Italiaans, Duits, Portugees, Deens, Grieks en Nederlands. EUROTRA is een hybride systeem. Het maakt gebruik van allerlei inzichten zoals constituentstructuren, dependentiestructuren, argumentstructuren, transfersystemen. De grammatica van EUROTRA bestaat uit: structure building rules (b-rules), refining rules en filter rules (strict rules, killer rules).

EUROTRA is modulair opgezet. De representatieniveaus in EUROTRA zijn steeds linguïstisch gemotiveerd. In EUROTRA zijn vijf niveaus te onderscheiden:

  1. Eurotra Normalized Text (ENT)
  2. Eurotra Morphological Structure (EMS)
  3. Eurotra Constituent Structure (ECS)
  4. Eurotra Relational Structure (ERS)
  5. Interface Structure (IS)

In ENT wordt de tekst genormaliseerd. De typografische woorden worden geïsoleerd. Leestekens als punten dienen als eindmarkeringen. Andere typografische kenmerken worden gestandardiseerd. In EMS wordt de interne woordopbouw ontleed. Dit levert een morfologische analyse op. Op het niveau van ECS wordt de syntactische structuur opgebouwd, zodat een constituentenstructuur wordt verkregen. In ERS worden de grammaticale relaties gegeven zoals subject (subj), object (obj), indirect object (iobj), prepositioneel object (pobj), enz. De semantische dependentierelaties worden toegekend in IS. Er ontstaat een structuur met de governor en zijn semantische argumenten. Deze semantische argumenten zijn afkomstig van de semantiek met diepte-casusrollen zoals diepte-subject (arg-1) en diepte-object (arg-2).

De niveaus ERS en IS zijn beide gebaseerd op dependentiegrammatica's. De semantische argumenten worden hierin geregeerd door een regeerder (governor), een hoofd dat een lexicale hoofdcategorie is (bijvoorbeeld V). In de EUROTRA-dependentiestructuur is telkens de governor van de argumenten gelowerd is, zodat de governor als zuster direct voor zijn argumenten staat. We krijgen dan de uniforme structuur:

    gov — arg1 ... argn   

De transfer is in EUROTRA zo eenvoudig mogelijk gehouden. Na de analyse volgt de synthese. Nu wordt de omgekeerde route bewandeld om uiteindelijk bij de vertaling in de doeltaal uit te komen:
IS (doeltaal) – ERS – ECS – EMS – ENT.



Voor opmerkingen of vragen over deze pagina kunt u contact opnemen met Simon van Dreumel
Laatst gewijzigd op 25 augustus 2025