Een multimodaal parallel corpus met de talen Spaans en Spaanse Gebarentaal (Lengua de Signos EspaƱola - LSE). 297 geschreven hotelbeoordelingen, oorspronkelijk in het Nederlands werden vertaald in het Spaans en vervolgens door 6 professionele, dove vertalers in het LSE. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen … [Lees meer...] overHotel Review Corpus in Spanish Sign Language – LSE_HoReCo
Corpus
Hotel Review Corpus in Nederlandse Gebarentaal – NGT_HoReCo
Een multimodaal parallel corpus met de talen Nederlands en Nederlandse Gebarentaal (NGT). 283 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de NGT-video's varieerde tussen 10 seconden … [Lees meer...] overHotel Review Corpus in Nederlandse Gebarentaal – NGT_HoReCo
Hotel Review Corpus in Vlaamse Gebarentaal – VGT_HoReCo
Een multimodaal parallel corpus met de talen Nederlands en Vlaamse Gebarentaal (VGT). 296 geschreven hotelbeoordelingen werden vertaald uit het Nederlands in NGT door 6 professionele, dove vertalers. Elke beoordeling is vertaald door slechts 1 vertaler. Het aantal woorden in de beoordelingen varieerde tussen 15 en 400. De duur van de VGT-video's varieerde tussen 10 seconden tot … [Lees meer...] overHotel Review Corpus in Vlaamse Gebarentaal – VGT_HoReCo
Gekaapte Brieven (Online)
Het corpus Gekaapte brieven bestaat uit de transcripties van 5862 brieven en andere documenten, zoals rekeningen, geschreven aan en van zeelieden en anderen uit het buitenland in de 17e en 18e eeuw. Deze brieven en documenten waren aanwezig op Nederlandse schepen die door de Engelsen waren gekaapt tijdens een van de vier oorlogen die in deze periode werden uitgevochten tussen … [Lees meer...] overGekaapte Brieven (Online)
Lassy Groot-corpus
Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties. Informatie over de veranderingen in de verschillende versies is te vinden in de README. Standaard wordt dit taalmateriaal als download aangeboden en dan zijn er geen kosten aan verbonden. Maar vanwege de grote hoeveelheid gegevens kan dit corpus ook … [Lees meer...] overLassy Groot-corpus