Een multimodaal parallel corpus met de talen Nederlands en Vlaamse Gebarentaal (VGT). 297 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de VGT-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 21.825 woorden in het Nederlands en ongeveer 4 uur aan VGT-videomateriaal.
A multimodal parallel corpus of Dutch and Flemish Sign Language (VGT). 297 hotel reviews in written Dutch were translated into VGT videos by 6 professional, deaf translators. Each review was translated by only one translator. The word length of the Dutch reviews varies from around 15 to 400 words; the duration of the VGT videos ranged from around 10 seconds to around 4 minutes. The total amount of words contained in the corpus is 21,825; the VGT translations consist of about 4 hours of videos.
Productdetails
Dataformaat | mp4, mov, txt |
Jaar | 2024 |
Opdrachtgever | |
Project | SignON |
Financier | SignON |
Documentatie | Project Report |
Refereren | Hotel Review Corpus Vlaamse Gebarentaal (VGT-HoReCo). (Version 1.1) (2024) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-y3. |
Talen | Nederlands, Vlaamse Gebarentaal |
Omvang | ±4 uur, 21.825 woorden |
Toepassing | Automatisch vertalen, ontwikkelen van taalmodellen |
Versie | 1.0 |
Licentie | Creative Commons Attribution-NonCommercial 4.0 Unported License. |
Downloaddetails
Bestand | |
---|---|
vgt_horeco1.1.zip |
- Aantal bestanden 1
- Aantal downloads 7
- Bestandsgrootte 146.62 MB
- Datum plaatsing 26/03/2024
- Laatst bijgewerkt 26/07/2024
- Versie 1.1