Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
A corpus of about 115 hours of Dutch speech from juveniles, non-native speakers and seniors, consisting of read text and man-machine dialogues.
Productdetails
Aantal uren spraak | 115 |
Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2008 |
Opdrachtgever | NTU|STEVIN |
Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
Refereren | JASMIN-spraakcorpus (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-j7 |
Talen | Nederlands, Vlaams |
Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_JASMIN_NC.zip |
- Aantal bestanden 1
- Aantal downloads 155
- Bestandsgrootte 170.90 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 15/10/2024
- Versie 1.0