Dit product bevat een uitbreiding van het NRC-emotielexicon. Het bevat een lijst met woorden in het Grieks, Koerdisch, Turks, Spaans, Farsi en Chinees (traditioneel en vereenvoudigd) en hun associaties met acht basisemoties (boosheid, angst, verwachting, vertrouwen, verrassing, verdriet, vreugde en afkeer) en twee sentimenten (negatief en positief). De annotaties zijn … [Lees meer...] overThe LiLaH Emotion Lexicon of Greek, Kurdish, Turkish, Spanish, Farsi and Chinese
Niet-commercieel
Corpus Vlaamse Gebarentaal (Corpus VGT)
Dit product bevat een selectie uit het Corpus Vlaamse Gebarentaal. Daaruit zijn de video's gekozen die op het moment van samenstellen voorzien waren van glossen. Zie de projectwebsite van het Corpus VGT voor meer details. Het Corpus VGT is een verzameling van video’s met Vlaamse Gebarentaal. Informanten (sprekers VGT) kregen per twee een reeks thema’s om over te praten: een … [Lees meer...] overCorpus Vlaamse Gebarentaal (Corpus VGT)
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS (Belgian Covid Sign language) corpus, bestaat uit het volledige archief van officiële persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die live … [Lees meer...] overBelgian Covid Sign Language Corpus (BeCoS Corpus)
Annotated Corpora for Term Extraction Research (ACTER)
ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie). ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind … [Lees meer...] overAnnotated Corpora for Term Extraction Research (ACTER)
BLISS Dialogue Summaries
Deze dataset bevat 557 conversaties tussen mens en computer die manueel geannoteerd zijn en voorzien van samenvattingen. Deze dataset is een uitbreiding op de originele BLISS Spoken Dialogue dataset die is uitgebracht in April 2020, met een klein aantal extra opgenomen mens-computer dialogen en Wizard-of-Oz mens-computerconversaties uit de originele JASMIN-CGN-dataset. Er zijn … [Lees meer...] overBLISS Dialogue Summaries