Het CHOREC-spraakcorpus (Children's Oral Reading Corpus) is een verzameling van 130 uur spraak, afkomstig van 400 Vlaamse kinderen die teksten en woordenlijsten voorlezen voor leesvaardigheidsontwikkeling en -toetsen. In het corpus zijn specifieke annotaties zoals leesstrategie en soorten leesfouten opgenomen. The CHOREC speech corpus (Children's Oral Reading Corpus) is a … [Lees meer...] overChildren’s Oral Reading Corpus (CHOREC)
Niet-commercieel
INT Historische Woordenlijst
De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper. The INT Historische Woordenlijst consists of 2 lists, each containing about 500,000 historical word forms for the purpose … [Lees meer...] overINT Historische Woordenlijst
Etymologisch Woordenboek van het Nederlands (EWN)
Het Etymologisch Woordenboek van het Nederlands (EWN) is een wetenschappelijk etymologisch woordenboek voor het moderne bovenregionale Nederlands. Dat betekent dat er in principe geen verouderde en dialectische trefwoorden zijn opgenomen, hoe interessant die etymologisch gezien ook kunnen zijn. Voor de basisselectie van de trefwoorden in het EWN is uitgegaan van Van Dale Groot … [Lees meer...] overEtymologisch Woordenboek van het Nederlands (EWN)
Cornetto-LMF
Lexicale database voor het Nederlands met semantische relaties en combinatorische informatie. Lexical database of Dutch, providing semantic relationships and combinatorial information. Ga naar website Details … [Lees meer...] overCornetto-LMF
BLISS Spoken Dialogue Dataset
Deze dataset bestaat uit Nederlandse spraakopnames van deelnemers die spreken met het BLISS-dialoogsysteem (v1) over alledaagse bezigheden en activiteiten waar ze plezier aan beleven. De data bevat 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden. Dutch recordings of participants who speak with the BLISS dialogue system about everyday occupations and … [Lees meer...] overBLISS Spoken Dialogue Dataset