De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl, vormen het product Meertalige Ondertiteldata 2BDutch. A corpus of subtitles belonging to the Dutch video’s on the website www.2BDutch.nl.
Een corpus bestaande uit circa 700 miljoen woorden dat automatisch voorzien werd van syntactische annotaties. Lassy Groot-corpus: A corpus of about 700 million words that has been annotated syntactically by machine.
Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen. A corpus of about 115 hours of Dutch speech from juveniles, non-native speakers and seniors, consisting of read text and man-machine dialogues.