Het SoNaR-corpus bevat ruim 500 miljoen woorden afkomstig uit (standaard) Nederlandstalige teksten van na 1954. The SoNaR Corpus contains more than 500 million words from texts in standard Dutch later than 1954.
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. Open Dutch Wordnet is a lexical dabase of Dutch containing 116,922 synsets.
Lexicon voor het Nederlands, met historische namen en varianten uit de periode 1750-1945. Lexicon for Dutch, featuring historical names and variants from the period between 1750 and 1945.
Moroccorp is een corpus van chats tussen Marokkaans-Nederlandse taalgebruikers, bestaande uit tien miljoen woorden. Moroccorp is a corpus of chats between Maroccan-Dutch language users consisting of about a million words.
De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl, vormen het product Meertalige Ondertiteldata 2BDutch. A corpus of subtitles belonging to the Dutch video’s on the website www.2BDutch.nl.