De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties
Lemma's
CoBaLT
CoBaLT is een applicatie om een verzameling tekstbestanden in te laden om vervolgens de tokens taalkundig te annoteren (o.a. lemmatiseren). Het annoteren met CoBaLT levert twee producten op: een geannoteerd corpus en een lexicon bestaande uit de geannoteerde woordvormen. Deze applicatie wordt gedistribueerd via GitHub. CoBaLT is an application in which a corpus of texts can … [Lees meer...] overCoBaLT