CombiLex is een lijst van woorden en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508. CombiLex is a list of lemmata and word forms with no added linguistic information. … [Lees meer...] overCombiLex Commercieel
Lemma's
WebCelex (Online)
Interface waarmee de CELEX-lexicale databases van het Duits, Engels, Nederlands kunnen worden geraadpleegd. Voor iedere taal zijn de lemma's aangevuld met orthografische, fonologische, morfologische en syntactische informatie en frequentiegegevens. Ten opzichte van de downloadversie van CELEX zijn aan deze online versie ook recentere woordvormen toegevoegd die de … [Lees meer...] overWebCelex (Online)
CGN-annotaties Commercieel
De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties Commercieel
CGN-annotaties
De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. Voor commercieel gebruik zie de commerciële productpagina. The CGN Annotations contain the … [Lees meer...] overCGN-annotaties
CoBaLT
CoBaLT is een applicatie om een verzameling tekstbestanden in te laden om vervolgens de tokens taalkundig te annoteren (o.a. lemmatiseren). Het annoteren met CoBaLT levert twee producten op: een geannoteerd corpus en een lexicon bestaande uit de geannoteerde woordvormen. Deze applicatie wordt gedistribueerd via GitHub. CoBaLT is an application in which a corpus of texts can … [Lees meer...] overCoBaLT