Eenwoordlexicon

Informatie

Het CGN-eenwoordlexicon is een woordenlijst, die bijna alle unieke woordvormen uit het corpus bevat. Ieder woord is voorzien van uitgebreide lexicale informatie over woordvorm, woordsoort, lemma, syntax, orthografische status, uitspraak en morfologie (zie velden eenwoordlexicon voor een gedetailleerde beschrijving van de velden).

Alleen woordvormen waarvoor uitgebreide lexicale informatie irrelevant is, staan er niet in. Het gaat hier om versprekingen, in de spraak afgebroken woorden, niet-ingeburgerde vreemdtalige woorden, leestekens en onverstaanbare uitingen.

Het CGN-lexicon bevat alleen aaneengeschreven woordvormen; meerwoordsuitdrukkingen met spaties staan in een apart meerwoordlexicon. Wel zijn in dit lexicon alle losse delen van deze meerwoordsuitdrukkingen opgenomen.

Opbouw
Het CGN-lexicon is gebaseerd op bestaande elektronische bronnen:
      # CELEX
      # RBN
      # PAROLE
      # FONILEX
      # Van Dale
      # de Woordenlijst Nederlandse Taal 1995 (Groene Boekje)
      # Corpus Uit den Boogaart
en is verder aangepast aan en aangevuld met voor analyse van het CGN-corpus benodigde informatie.

Zoeken binnen het eenwoordlexicon in Corex
Om in het lexicon te zoeken kunnen we gebruikmaken van de Lexicon Tool. U vindt deze in het hoofdmenu van het Corex-openingsvenster onder “Search”. Met de Lexicon Tool kunt u bijvoorbeeld een lijst van alle werkwoorden in het CGN genereren. Elk werkwoord in de lijst wordt dan voorzien van uitgebreide lexicale informatie.

Voorbeeld Eenwoordlexicon

In de lexicon tool kunt u ook een zoekactie op basis van meerdere zoekcriteria opbouwen. Na het defiiniëren van het eerste criterium, klikt u op “ find” waardoor een lijst met resultaten verschijnt. Vervolgens vinkt u het vakje “Within results” aan, waarna u een tweede zoekcriterium kunt definiëren : wanneer u nu de zoekactie start, zal er enkel gezocht worden binnen de resultaten van de eerste zoekactie.