Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
Voor commercieel gebruik zie de commerciële productpagina.
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
For commercial use, see the commercial product page.
Productdetails
Aantal uren spraak | 115 |
Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2008 |
Opdrachtgever | NTU|STEVIN |
Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
Refereren | JASMIN-spraakcorpus (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-j7 |
Talen | Nederlands, Vlaams |
Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_JASMIN_NC.zip |
- Aantal bestanden 1
- Aantal downloads 228
- Bestandsgrootte 170.90 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 10/10/2025
- Versie 1.0