Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 297 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de NGT-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 22.197 woorden in het Nederlands en zo'n 3 uur en 50 minuten aan NGT-videomateriaal.
Versie 1.2 bevat 14 additionele video's ten opzichte van de voorgaande versies.
A multimodal parallel corpus of Dutch and Sign Language of the Netherlands (NGT). 297 hotel reviews in written Dutch were translated into NGT videos by 6 professional, deaf translators. Each review was translated by only one translator. The word length of the Dutch reviews varies from around 15 to 400 words; the NGT videos duration ranged from around 10 seconds to around 4 minutes. The total amount of words contained in the corpus is 22,197; the NGT translations consist of about 3 hours and 50 minutes of videos.
Version 1.2 contains 14 additional videos compared to the previous versions.
Productdetails
Dataformaat | mp4, mov, txt |
Jaar | 2024 |
Opdrachtgever | |
Project | NGT-HoReCo |
Financier | European Language Equality 2 (ELE2) |
Documentatie | Project Report |
Refereren | Hotel Review Corpus Nederlandse Gebarentaal (NGT-HoReCo) (Version 1.2) (2024) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-x7. |
Talen | Nederlands, Nederlandse Gebarentaal |
Omvang | ± 4 uur, 22.197 woorden |
Toepassing | Automatisch vertalen, ontwikkelen van taalmodellen |
Versie | 1.2 |
Licentie | Creative Commons Attribution-NonCommercial 3.0 Unported License. |
Downloaddetails
Bestand | |
---|---|
NGT_HoReCo_1.2.zip |
- Aantal bestanden 1
- Aantal downloads 38
- Bestandsgrootte 146.62 MB
- Datum plaatsing 12/02/2024
- Laatst bijgewerkt 13/12/2024
- Versie 1.2