Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is een taalkundig geannoteerd corpus, gebaseerd op een unieke collectie van dialectopnames (Stemmen uit het Verleden) uit 768 verschillende plaatsen in BelgiĆ«, het noorden van Frankrijk en het zuiden van Nederland bij in het algemeen weinig mobiele en laagopgeleide sprekers geboren rond 1900. De opnames werden … [Lees meer...] overGesproken Corpus van de zuidelijk-Nederlandse Dialecten – GCND (Online)
Spraak
Spoken Academic Belgian Dutch Corpus – SABeD
Het Spoken Academic Belgian Dutch Corpus (SABeD) bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de … [Lees meer...] overSpoken Academic Belgian Dutch Corpus – SABeD
Spoken Academic Belgian Dutch Corpus (SABeD)
Het Spoken Academic Belgian Dutch Corpus bestaat uit gedeeltes van 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en … [Lees meer...] overSpoken Academic Belgian Dutch Corpus (SABeD)
Belgian Covid Sign Language Corpus – BeCoS Corpus
Het Belgische Federale COVID-19-corpus, genaamd het BeCoS-corpus (Belgian Covid Sign language corpus), bestaat uit het volledige archief van officiĆ«le persconferenties van de Belgische federale overheid betreffende de COVID-19-pandemie. De sprekers spreken meestal Nederlands of Frans en een enkele keer Duits, en bijna alle spraak wordt getolkt door een dove gebarentaaltolk die … [Lees meer...] overBelgian Covid Sign Language Corpus – BeCoS Corpus
BLISS Dialogue Summaries
Deze dataset bevat 557 conversaties tussen mens en computer die manueel geannoteerd zijn en voorzien van samenvattingen. Deze dataset is een uitbreiding op de originele BLISS Spoken Dialogue dataset die is uitgebracht in april 2020, met een klein aantal extra opgenomen mens-computer dialogen en Wizard-of-Oz mens-computerconversaties uit de originele JASMIN-CGN-dataset. Er zijn … [Lees meer...] overBLISS Dialogue Summaries