Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN).
The JASMIN speech corpus is a collection of approximately 115 hours of Dutch speech from adolescents, non-native speakers and seniors living in Flanders and the Netherlands. The speech recordings consist of read-aloud texts and human-machine dialogues, and are enriched with various annotation layers. The JASMIN speech corpus complements the Corpus Gesproken Nederlands (CGN).
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Aantal uren spraak | 115 |
Dataformaat | Spraakbestanden (wav) en annotaties (txt, TextGrid) |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2008 |
Opdrachtgever | NTU|STEVIN |
Project | JASMIN-CGN: Jongeren, Anderstaligen, Senioren en Machine Interactie voor het Nederlands |
Projectwebsite | http://www.esat.kuleuven.be/psi/spraak/projects/JASMIN/ |
Refereren | JASMIN-spraakcorpus Commercieel (Version 1.0) (2008) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-e4 |
Talen | Nederlands, Vlaams |
Toepassing | Voornamelijk voor onderzoek, geluidsbestanden worden gebruikt voor het testen van spraakherkenners. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_JASMIN_C.zip |
- Aantal bestanden 1
- Aantal downloads 50
- Bestandsgrootte 171.49 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 22/04/2025
- Versie 1.0