EUROTRA is een vertaalsysteem dat negen talen omvat: Engels, Frans, Spaans,
Italiaans, Duits, Portugees, Deens, Grieks en Nederlands.
EUROTRA is een hybride systeem. Het maakt gebruik van allerlei inzichten
zoals constituentstructuren, dependentiestructuren, argumentstructuren,
transfersystemen.
De grammatica van EUROTRA bestaat uit:
structure building rules (b-rules),
refining rules en filter rules (strict rules, killer rules).
EUROTRA is modulair opgezet.
De representatieniveaus in EUROTRA zijn steeds linguïstisch gemotiveerd.
In EUROTRA zijn vijf niveaus te onderscheiden:
- Eurotra Normalized Text (ENT)
- Eurotra Morphological Structure (EMS)
- Eurotra Constituent Structure (ECS)
- Eurotra Relational Structure (ERS)
- Interface Structure (IS)
In ENT wordt de tekst genormaliseerd. De typografische woorden worden
geïsoleerd. Leestekens als punten dienen als eindmarkeringen.
Andere typografische kenmerken worden gestandardiseerd.
In EMS wordt de interne woordopbouw ontleed. Dit levert een morfologische
analyse op.
Op het niveau van ECS wordt de syntactische structuur opgebouwd, zodat een
constituentenstructuur wordt verkregen.
In ERS worden de grammaticale relaties gegeven zoals subject (subj),
object (obj), indirect object (iobj), prepositioneel object (pobj), enz.
De semantische dependentierelaties worden toegekend in IS. Er ontstaat
een structuur met de governor en zijn semantische argumenten.
Deze semantische argumenten zijn afkomstig van de semantiek met
diepte-casusrollen zoals diepte-subject (arg-1) en
diepte-object (arg-2).
De niveaus ERS en IS zijn beide gebaseerd op dependentiegrammatica's.
De semantische argumenten worden hierin geregeerd door een regeerder
(governor), een hoofd dat een lexicale hoofdcategorie is
(bijvoorbeeld V).
In de EUROTRA-dependentiestructuur is telkens de governor
van de argumenten gelowerd is, zodat de governor als zuster direct voor
zijn argumenten staat.
We krijgen dan de uniforme structuur:
De transfer is in EUROTRA zo eenvoudig mogelijk gehouden.
Na de analyse volgt de synthese. Nu wordt de omgekeerde route
bewandeld om uiteindelijk bij de vertaling in de doeltaal uit te komen:
IS (doeltaal) ERS ECS EMS ENT.