De ondertiteldata behorend bij de Nederlandstalige video’s op de website, vormen het product Meertalige Ondertiteldata 2BDutch. A corpus of subtitles belonging to the Dutch video’s on the website
Een corpus bestaande uit circa 700 miljoen woorden dat automatisch voorzien werd van syntactische annotaties. Lassy Groot-corpus: A corpus of about 700 million words that has been annotated syntactically by machine.
Een corpus bestaande uit circa 476 miljoen woorden dat automatisch voorzien werd van syntactische annotaties. The corpus contains about about 476 million words with automatically generated syntactic annotations.