Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, wat heeft geresulteerd in 5677 extra geluidsbestanden. Alle uitingen zijn handmatig fonetisch getranscribeerd.
The AUTONOMATA-POI corpus is a database of 800 points of interest (POIs) from the Netherlands and Belgium read aloud. Te database consists of names of restaurants, hotels, campsites, cafes, etc. The corpus contains recordings of 80 speakers with different language backgrounds, totalling 16,000 sound files. In addition, speakers were allowed to record multiple attempts for a POI, resulting in 5677 additional sound files. All utterances were manually phonetically transcribed.
Productdetails
Dataformaat | Spraakbestanden (wav), Fon. transcripties (txt) |
Documentatie | Documentatie |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2010 |
Opdrachtgever | NTU|STEVIN |
Project | AUTONOMATA Too |
Projectwebsite | http://lands.let.ru.nl/projects/AutonomataToo/index.php |
Refereren | AUTONOMATA POI-corpus (Version 1.0) (2010) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-n7 |
Talen | Nederlands, Vlaams |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
AUTONOMATA-POI-corpus_1.0.tgz |
- Aantal bestanden 1
- Aantal downloads 17
- Bestandsgrootte 1,040.77 MB
- Datum plaatsing 17/07/2020
- Laatst bijgewerkt 07/02/2025
- Versie 1.0