Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
This product is free, but signing a license agreement is required. The download contains the license and further instructions for placing an order.
Productdetails
| Aantal uren spraak | 115 |
| Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
| Documentatie | LREC2008-artikel |
| Eigenaar | Taalunie |
| Financier | NTU|STEVIN |
| Jaar | 2008 |
| Opdrachtgever | NTU|STEVIN |
| Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
| Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
| Refereren | JASMIN-spraakcorpus Commercieel (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-e4 |
| Talen | Nederlands, Vlaams |
| Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
| Versie | 1.0 |
Downloaddetails
| Bestand | |
|---|---|
| BP_JASMIN_C.zip |
- Aantal bestanden 1
- Aantal downloads 71
- Bestandsgrootte 171.49 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 15/12/2025
- Versie 1.0