Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
Productdetails
Aantal uren spraak | 115 |
Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2008 |
Opdrachtgever | NTU|STEVIN |
Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
Refereren | JASMIN-spraakcorpus (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-j7 |
Talen | Nederlands, Vlaams |
Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_JASMIN_NC.zip |
- Aantal bestanden 1
- Aantal downloads 201
- Bestandsgrootte 170.90 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 22/04/2025
- Versie 1.0