Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Niet-commercieel
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS-corpus (Belgian Covid Sign language corpus), bestaat uit het volledige archief van officiële persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die … [Lees meer...] overBelgian Covid Sign Language Corpus (BeCoS Corpus)
CELEX-2 Dutch
CELEX is ontwikkeld in een samenwerkend verband tussen de Universiteit van Nijmegen, het Instituut voor de Nederlandse Lexicologie (tegenwoordig het Instituut voor de Nederlandse Taal - INT), het Max Planck Instituut voor Psycholinguïstiek in Nijmegen en het Instituut voor Perceptie Onderzoek te Eindhoven. De oorspronkelijke versie verscheen op cd-rom en bevatte ASCII-versies … [Lees meer...] overCELEX-2 Dutch
Hotel Review Corpus in Nederlandse Gebarentaal (NGT_HoReCo)
Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 283 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de NGT-video's varieerde tussen 10 seconden … [Lees meer...] overHotel Review Corpus in Nederlandse Gebarentaal (NGT_HoReCo)
The LiLaH Emotion Lexicon of Greek, Kurdish, Turkish, Spanish, Farsi and Chinese
Dit product bevat een uitbreiding van het NRC-emotielexicon. Het bevat een lijst met woorden in het Grieks, Koerdisch, Turks, Spaans, Farsi en Chinees (traditioneel en vereenvoudigd) en hun associaties met acht basisemoties (boosheid, angst, verwachting, vertrouwen, verrassing, verdriet, vreugde en afkeer) en twee sentimenten (negatief en positief). De annotaties zijn … [Lees meer...] overThe LiLaH Emotion Lexicon of Greek, Kurdish, Turkish, Spanish, Farsi and Chinese