Een multimodaal parallel corpus met de talen Spaans en Spaanse Gebarentaal (Lengua de Signos Española - LSE). 297 geschreven hotelbeoordelingen, oorspronkelijk in het Nederlands werden vertaald in het Spaans en vervolgens door 6 professionele, dove vertalers in het LSE. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de LTE-video's varieerde tussen 10 seconden tot ongeveer 4 minuten. Het resulterende corpus bevat 20.609 woorden in het Spaans en ruim 3 uur aan LTE-videomateriaal.
A multimodal parallel corpus of Spanish and Spanish Sign Language (Lengua de Signos Española - LSE). 297 hotel reviews, originally written in Dutch were translated into Spanish and subsequently in LSE videos by 6 professional, deaf translators. Each review was translated by only one translator. The word length of the Spanish reviews varies from around 15 to 400 words; the LSE videos duration ranged from around 10 seconds to around 4 minutes. The total amount of words contained in the corpus is 20,609; the LSE translations consist of over 3 hours of videos.
Productdetails
Dataformaat | mp4, mov, txt |
Jaar | 2024 |
Opdrachtgever | |
Project | SignON |
Financier | SignON |
Documentatie | Project Report |
Refereren | Hotel Review Corpus Spanish Sign Language (LSE-HoReCo). Version 1.0, Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-x6. |
Talen | Nederlands, Nederlandse Gebarentaal |
Omvang | ±3 uur, 20609 woorden |
Toepassing | Automatisch vertalen, ontwikkelen van taalmodellen |
Versie | 1.0 |
Licentie | Creative Commons Attribution-NonCommercial 3.0 Unported License. |
Downloaddetails
Bestand | |
---|---|
LSE_HoReCo_1.0.zip |
- Aantal bestanden 1
- Aantal downloads 9
- Bestandsgrootte 146.62 MB
- Datum plaatsing 08/02/2024
- Laatst bijgewerkt 26/11/2024
- Versie 1.0