Moroccorp is een corpus van chats tussen Marokkaans-Nederlandse taalgebruikers, bestaande uit tien miljoen woorden. De data wordt aangeboden als een tekstbestand van 82.4 Mb. Moroccorp is a corpus of computer-mediated communication in Dutch by Moroccan-Dutch language users, consisting of ten million words of chat material. The data is delivered in a .txt file of 82.4 … [Lees meer...] overMoroccorp
Corpus
Meertalige Ondertiteldata 2BDutch
De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl , vormt het product Meertalige Ondertiteldata 2BDutch. Op de website van 2BDutch staan video's met ondertitelingsmogelijkheid in verschillende talen. Met deze video's kunnen studenten Nederlands van alle niveaus hun luistervaardigheden oefenen en nieuwe Nederlandse woorden leren.De … [Lees meer...] overMeertalige Ondertiteldata 2BDutch
Lwazi Xitsonga ASR Corpus
Complete audio recordings and orthographic transcriptions used for Lwazi speech recognition systems. Productdetails Aantal uren spraak 520 min Annotaties Transcriptions: a) One utterance per file b) ANSI (Unicode) c) txt Audio: a) 8 KHz b) 16-bit c) 1 Channel; telephone d) wav Dataformaat Speech Documentatie Lwazi Project Final Report "Development of … [Lees meer...] overLwazi Xitsonga ASR Corpus
Lwazi Tshivenda ASR corpus
Complete audio recordings and orthographic transcriptions used for Lwazi speech recognition systems. Productdetails Aantal uren spraak 433 min Annotaties Transcriptions: a) One utterance per file b) ANSI (Unicode) c) txt Audio: a) 8 KHz b) 16-bit c) 1 Channel; telephone d) wav Dataformaat Speech Documentatie Lwazi Project Final Report "Development of … [Lees meer...] overLwazi Tshivenda ASR corpus
Lwazi Siswati ASR Corpus
Complete audio recordings and orthographic transcriptions used for Lwazi speech recognition systems. Productdetails Aantal uren spraak 634 min Annotaties Transcriptions: a) One utterance per file b) ANSI (Unicode) c) txt Audio: a) 8 KHz b) 16-bit c) 1 Channel; telephone d) wav Dataformaat Speech Documentatie Lwazi Project Final Report "Development of … [Lees meer...] overLwazi Siswati ASR Corpus