Een multimodaal parallel corpus met de talen Nederlands en Vlaamse Gebarentaal (VGT). 296 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de VGT-video's varieerde tussen 10 seconden tot … [Lees meer...] overHotel Review Corpus in Vlaamse Gebarentaal (VGT_HoReCo)
Niet-commercieel
META-Covid Ontology 1.0
De META-COVID Ontology verbindt 30 interdisciplenaire COVID-onderwerpen met 203 specifieke concepten vanuit wetenschappelijke ontologieën. Deze ontologie is ontwikkeld binnen het EOSC Futureproject als onderdeel van het wetenschappelijk proefproject "COVID-19 metadata findability and interoperability in EOSC (META-COVID)". Meer informatie is te vinden in de Github repository … [Lees meer...] overMETA-Covid Ontology 1.0
Lassy Groot-corpus
Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. Informatie over de veranderingen in de verschillende versies is te vinden in de README. Standaard wordt dit taalmateriaal als download aangeboden en dan zijn er geen kosten aan verbonden. Maar vanwege de grote hoeveelheid gegevens kan dit corpus ook … [Lees meer...] overLassy Groot-corpus
Lassy Klein-corpus
Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS-corpus (Belgian Covid Sign language corpus), bestaat uit het volledige archief van officiële persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die … [Lees meer...] overBelgian Covid Sign Language Corpus (BeCoS Corpus)