Het SoNaR-corpus bevat ruim 500 miljoen woorden afkomstig uit (standaard) Nederlandstalige teksten van na 1954. The SoNaR Corpus contains more than 500 million words from texts in standard Dutch later than 1954.
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. Open Dutch Wordnet is a lexical dabase of Dutch containing 116922 synsets.
Moroccorp is een corpus van chats tussen Marokkaans-Nederlandse taalgebruikers, bestaande uit tien miljoen woorden. Moroccorp is a corpus of chats between Maroccan-Dutch language users consisting of about a million words.
De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl, vormen het product Meertalige Ondertiteldata 2BDutch. A corpus of subtitles belonging to the Dutch video’s on the website www.2BDutch.nl.