Deze dataset bestaat uit Nederlandse spraakopnames van deelnemers die spreken met het BLISS-dialoogsysteem (v1) over alledaagse bezigheden en activiteiten waar ze plezier aan beleven. De data bevat 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden. Deze versie is vervallen. Een nieuwe versie is hier beschikbaar: http://hdl.handle.net/10032/tm-a2-v3 Dutch … [Lees meer...] overBLISS Dialogue Summaries
Grafzerk
Lassy Klein-corpus
Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Hoger Onderwijs Terminologie in Nederland en Vlaanderen (HOTNeV)
Een terminologische database met Nederlandse en Vlaamse onderwijstermen. De aanzet voor dit project vormde de sterke toename van onderwijstermen, gegenereerd door het onderwijsbeleid van de EU en geïmplementeerd door het Tuning Project. HOTNeV beoogt een tweeledig doel. Waar tot op heden Nederlandstalige equivalenten voor de Engelstalige terminologie vooral ad hoc werden … [Lees meer...] overHoger Onderwijs Terminologie in Nederland en Vlaanderen (HOTNeV)
Wablieft-corpus
Waarschuwing: Dit is niet de meest actuele versie van het Wablieft-corpus. De nieuwste versie is: Wablieft-corpus 1.2. Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief. Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is … [Lees meer...] overWablieft-corpus
Wablieft-corpus
Waarschuwing: Dit is niet de meest actuele versie van het Wablieft-corpus. De nieuwste versie is: Wablieft-corpus 1.2. Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief. Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata … [Lees meer...] overWablieft-corpus