Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN). The … [Lees meer...] overJASMIN-spraakcorpus Commercieel
Spraak
IFA Dialogue Video corpus
Het IFA Dialogue Video corpus corpus bestaat uit video- en geluidsopnamen van spontane dialogen tussen proefpersonen. Het bevat 24 video-opnames van spontane dialogen, waarvan er 20 zijn geannoteerd. 42 proefpersonen (14 mannelijk, 28 vrouwelijk) participeerden in dit onderzoek. The IFA Dialogue Video corpus consists of video and audio recordings of spontaneous dialogues … [Lees meer...] overIFA Dialogue Video corpus
IFA Corpus
Het IFA Corpus is een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk. Het corpus bevat in totaal zo'n 50.000 woorden die zijn gesegmenteerd op foneemniveau. The IFA Corpus is a phonetic research database consisting of Dutch speech data from 8 individuals; 4 male and 4 female. The corpus contains a total … [Lees meer...] overIFA Corpus
Corpus Pathologische en Normale Spraak (COPAS)
Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De … [Lees meer...] overCorpus Pathologische en Normale Spraak (COPAS)
Corpus Gesproken Nederlands (CGN)
Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica en frequentielijsten behoren ook tot … [Lees meer...] overCorpus Gesproken Nederlands (CGN)