Het Belgische Federale COVID-19-corpus, genaamd het BeCoS-corpus (Belgian Covid Sign language corpus), bestaat uit het volledige archief van officiële persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die … [Lees meer...] overBelgian Covid Sign Language Corpus – BeCoS Corpus
Productpagina
CELEX-2 Dutch
CELEX is ontwikkeld in een samenwerkend verband tussen de Universiteit van Nijmegen, het Instituut voor de Nederlandse Lexicologie (tegenwoordig het Instituut voor de Nederlandse Taal - INT), het Max Planck Instituut voor Psycholinguïstiek in Nijmegen en het Instituut voor Perceptie Onderzoek te Eindhoven. De oorspronkelijke versie verscheen op cd-rom en bevatte ASCII-versies … [Lees meer...] overCELEX-2 Dutch
SoNaR Character N-grams
Uit het SoNaR-corpus versie 1.2 (SONAR500) zijn n-grammen van lettertekenreeksen met lengtes 1, 2 en 3 afgeleid. Van de originele bestanden werden tekstbestanden gemaakt in UTF-8. Op basis van die bestanden werden met een Perlscript - dat meegeleverd wordt - de n-grammen berekend, die vervolgens werden weggeschreven naar een tab-gescheiden bestand. Hoofdletters werden omgezet … [Lees meer...] overSoNaR Character N-grams
Hoger Onderwijs Terminologie in Nederland en Vlaanderen – HOTNeV
Dit taalmateriaal is een terminologiedatabase met Nederlandse en Vlaamse termen uit het onderwijsdomein. De aanzet voor dit project vormde de sterke toename van onderwijstermen, gegenereerd door het onderwijsbeleid van de EU en geïmplementeerd door het Tuning Project. HOTNeV beoogt een tweeledig doel. Waar tot op heden Nederlandstalige equivalenten voor de Engelstalige … [Lees meer...] overHoger Onderwijs Terminologie in Nederland en Vlaanderen – HOTNeV
The LiLaH Emotion Lexicon of Greek, Kurdish, Turkish, Spanish, Farsi and Chinese
Dit product bevat een uitbreiding van het NRC-emotielexicon. Het bevat een lijst met woorden in het Grieks, Koerdisch, Turks, Spaans, Farsi en Chinees (traditioneel en vereenvoudigd) en hun associaties met acht basisemoties (boosheid, angst, verwachting, vertrouwen, verrassing, verdriet, vreugde en afkeer) en twee sentimenten (negatief en positief). De annotaties zijn … [Lees meer...] overThe LiLaH Emotion Lexicon of Greek, Kurdish, Turkish, Spanish, Farsi and Chinese