Lexicologische Koppeling

Informatie

De lexicologische koppeling van het CGN houdt in dat delen van meerledige uitdrukkingen met elkaar verbonden worden.

Zo zijn bijvoorbeeld de woorden “belt” en “op” in de zin “hij belt zijn vrouw op” lexicologisch gekoppeld. Door die verbintenis kunt u de hele uitdrukking terugvinden als u op een van de delen zoekt.

De volgende soorten uitdrukkingen zijn gekoppeld:
     # discontinu: scheidbaar samengestelde werkwoorden (bv. nam op, halen adem)
     # continu: ingeburgerde vreemdtalige uitdrukkingen (bv. et cetera, wishful thinking) in- en
        uitheemse eigennamen en titels (bv. Berg en Dal, Avril Lavigne, De Morgen, De Pfaffs)

In het hele corpus zijn automatisch mogelijke meerwoordsuitdrukkingen in kaart gebracht, die daarna handmatig zijn geverifieerd. Voor de geverifieerde uitdrukkingen zijn verwijzingen in de POS-annotaties aangebracht.

Gedetailleerde informatie over de werkwijze voor het genereren van de lexicologische koppeling werd vastgelegd in een protocol.