Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
Voor commercieel gebruik zie de commerciële productpagina.
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
For commercial use, see the commercial product page.
This product is free, but signing a license agreement is required. The download contains the license and further instructions for placing an order.
Productdetails
| Aantal uren spraak | 115 |
| Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
| Documentatie | LREC2008-artikel |
| Eigenaar | Taalunie |
| Financier | NTU|STEVIN |
| Jaar | 2008 |
| Opdrachtgever | NTU|STEVIN |
| Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
| Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
| Refereren | JASMIN-spraakcorpus (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-j7 |
| Talen | Nederlands, Vlaams |
| Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
| Versie | 1.0 |
Downloaddetails
| Bestand | |
|---|---|
| BP_JASMIN_NC.zip |
- Aantal bestanden 1
- Aantal downloads 245
- Bestandsgrootte 170.90 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 15/12/2025
- Versie 1.0