Niet-commercieel (non-commercial)

Moroccorp

Moroccorp is een corpus van chats tussen Marokkaans-Nederlandse taalgebruikers, bestaande uit tien miljoen woorden. De data wordt aangeboden als een tekstbestand van 82.4 Mb. Moroccorp is a corpus of computer-mediated communication in Dutch by Moroccan-Dutch language users, consisting of ten million words of chat material. The data is delivered in a .txt file of 82.4 … [Lees meer...] overMoroccorp

Meertalige Ondertiteldata 2BDutch

De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl , vormt het product Meertalige Ondertiteldata 2BDutch. Op de website van 2BDutch staan video's met ondertitelingsmogelijkheid in verschillende talen. Met deze video's kunnen studenten Nederlands van alle niveaus hun luistervaardigheden oefenen en nieuwe Nederlandse woorden leren.De … [Lees meer...] overMeertalige Ondertiteldata 2BDutch

Medische Termen Belgisch-Nederlands (MedTermBN)

Medische Termen Belgisch-Nederlands bestaat uit een lijst met een groot aantal Nederlandstalige medische termen die in België of in Nederland worden gebruikt. Van deze termen mag niet worden aangenomen dat zij in beide landen worden gebruikt en begrepen. De opgenomen termen zijn afkomstig uit verschillende gebruiksregisters en betreffen in hoofdzaak woorden en uitdrukkingen uit … [Lees meer...] overMedische Termen Belgisch-Nederlands (MedTermBN)

JASMIN-spraakcorpus

Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN). Voor … [Lees meer...] overJASMIN-spraakcorpus

IFA Dialogue Video corpus

Het IFA Dialogue Video corpus corpus bestaat uit video- en geluidsopnamen van spontane dialogen tussen proefpersonen. Het bevat 24 video-opnames van spontane dialogen, waarvan er 20 zijn geannoteerd. 42 proefpersonen (14 mannelijk, 28 vrouwelijk) participeerden in dit onderzoek. The IFA Dialogue Video corpus consists of video and audio recordings of spontaneous dialogues … [Lees meer...] overIFA Dialogue Video corpus

« Vorige