Deze dataset bestaat uit Nederlandse spraakopnames van deelnemers die spreken met het BLISS-dialoogsysteem (v1) over alledaagse bezigheden en activiteiten waar ze plezier aan beleven. De data bevat 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden. Deze versie is vervallen. Een nieuwe versie is hier beschikbaar: http://hdl.handle.net/10032/tm-a2-v3 Dutch … [Lees meer...] overBLISS Dialogue Summaries
Niet-commercieel
WAI-NOT Corpus
Het WAI-NOT Ccorpus bestaat uit 874 krantenartikels, afkomstig uit de WAI-NOT-krant. De artikels zijn opgesteld in eenvoudig te lezen Nederlands en zijn afkomstig uit de periode 2009-2021. Het corpus bevat ongeveer 75.000 woorden. De artikels zijn beschikbaar als xml-bestanden met daarin een titel, de artikeltekst en een datum. Die datum kan de oorspronkelijke … [Lees meer...] overWAI-NOT Corpus
Woordcombinaties (Online)
Woordcombinaties is een online naslagwerk in ontwikkeling dat geavanceerde leerders en gebruikers van het Nederlands ondersteunt bij het gebruiken van woorden in context. De tool toont hoe woorden gebruikt worden in voorbeeldzinnen, welke woorden typisch en/of vaak met elkaar gecombineerd worden en hoe (valentie)patronen samen met collocaties gebruikt worden voor het bouwen van … [Lees meer...] overWoordcombinaties (Online)
Lassy Klein-corpus
Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Medische Pilot (MedPilot)
De Medische Pilot is een bij wijze van experiment ingerichte database waarin een klein deel van de medische woordschat beschreven wordt op verschillende niveaus, van wetenschappelijk tot toegankelijk voor laaggeletterden, en waarin ook verschillen tussen Vlaamse en Nederlandse termen worden getoond. 152 indextermen zijn volledig bewerkt en beschikbaar voor export. Daarvan zijn … [Lees meer...] overMedische Pilot (MedPilot)