Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
Voor commercieel gebruik zie de commerciële productpagina.
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
For commercial use, see the commercial product page.
Productdetails
| Aantal uren spraak | 115 |
| Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
| Documentatie | LREC2008-artikel |
| Eigenaar | Taalunie |
| Financier | NTU|STEVIN |
| Jaar | 2008 |
| Opdrachtgever | NTU|STEVIN |
| Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
| Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
| Refereren | JASMIN-spraakcorpus (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-j7 |
| Talen | Nederlands, Vlaams |
| Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
| Versie | 1.0 |
Downloaddetails
| Bestand | |
|---|---|
| BP_JASMIN_NC.zip |
- Aantal bestanden 1
- Aantal downloads 233
- Bestandsgrootte 170.90 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 10/10/2025
- Versie 1.0