Het Spoken Academic Belgian Dutch Corpus bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de … [Lees meer...] overSpoken Academic Belgian Dutch Corpus (SABeD)
Spraak
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS-corpus (Belgian Covid Sign language corpus), bestaat uit het volledige archief van officiĆ«le persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die … [Lees meer...] overBelgian Covid Sign Language Corpus (BeCoS Corpus)
BLISS Dialogue Summaries
Deze dataset bevat 557 conversaties tussen mens en computer die manueel geannoteerd zijn en voorzien van samenvattingen. Deze dataset is een uitbreiding op de originele BLISS Spoken Dialogue dataset die is uitgebracht in April 2020, met een klein aantal extra opgenomen mens-computer dialogen en Wizard-of-Oz mens-computerconversaties uit de originele JASMIN-CGN-dataset. Er zijn … [Lees meer...] overBLISS Dialogue Summaries
BLISS Dialogue Summaries
Deze dataset bestaat uit Nederlandse spraakopnames van deelnemers die spreken met het BLISS-dialoogsysteem (v1) over alledaagse bezigheden en activiteiten waar ze plezier aan beleven. De data bevat 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden. Deze versie is vervallen. Een nieuwe versie is hier beschikbaar: http://hdl.handle.net/10032/tm-a2-v3 Dutch … [Lees meer...] overBLISS Dialogue Summaries
Corpus Ondertitelde UvN-colleges (COUC)
Dit corpus bevat 57 ondertitelde colleges van de Universiteit van Nederland (UvN). Ondertitels werden toegevoegd aan bestaande video-opnames van colleges van de UvN. In tegenstelling tot gewone ondertitels zijn de ondertitels die in dit project werden gegenereerd een bijna 100% letterlijke weergave van de spraak zoals gesproken door de mensen in de opnames. Ze bevatten … [Lees meer...] overCorpus Ondertitelde UvN-colleges (COUC)