Dit product bevat een selectie uit het Corpus Vlaamse Gebarentaal. Daaruit zijn de video's gekozen die op het moment van samenstellen voorzien waren van glossen. Zie de projectwebsite van het Corpus VGT voor meer details. Het Corpus VGT is een verzameling van video’s met Vlaamse Gebarentaal. Informanten (sprekers VGT) kregen per twee een reeks thema’s om over te praten: een … [Lees meer...] overCorpus Vlaamse Gebarentaal (Corpus VGT)
Niet-commercieel
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS (Belgian Covid Sign language) corpus, bestaat uit het volledige archief van officiële persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die live … [Lees meer...] overBelgian Covid Sign Language Corpus (BeCoS Corpus)
Annotated Corpora for Term Extraction Research (ACTER)
ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie). ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind … [Lees meer...] overAnnotated Corpora for Term Extraction Research (ACTER)
BLISS Dialogue Summaries
Deze dataset bevat 557 conversaties tussen mens en computer die manueel geannoteerd zijn en voorzien van samenvattingen. Deze dataset is een uitbreiding op de originele BLISS Spoken Dialogue dataset die is uitgebracht in April 2020, met een klein aantal extra opgenomen mens-computer dialogen en Wizard-of-Oz mens-computerconversaties uit de originele JASMIN-CGN-dataset. Er zijn … [Lees meer...] overBLISS Dialogue Summaries
Couranten Corpus (Online)
Het Couranten Corpus bevat dertien zeventiende-eeuwse Nederlandse kranten uit de periode 1619-1700 die momenteel op Delpher.nl beschikbaar zijn. Er zijn 109.532 artikelen in te vinden met een totaal van 18.926.425 woorden. Het corpus is doorzoekbaar via een webapplicatie. The Courant Corpus contains thirteen seventeenth-century Dutch newspapers from the period 1619-1700, … [Lees meer...] overCouranten Corpus (Online)