Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Niet-commercieel
Medische Pilot (MedPilot)
De Medische Pilot is een bij wijze van experiment ingerichte database waarin een klein deel van de medische woordschat beschreven wordt op verschillende niveaus, van wetenschappelijk tot toegankelijk voor laaggeletterden, en waarin ook verschillen tussen Vlaamse en Nederlandse termen worden getoond. 152 indextermen zijn volledig bewerkt en beschikbaar voor export. Daarvan zijn … [Lees meer...] overMedische Pilot (MedPilot)
Hoger Onderwijs Terminologie in Nederland en Vlaanderen (HOTNeV)
Een terminologische database met Nederlandse en Vlaamse onderwijstermen. De aanzet voor dit project vormde de sterke toename van onderwijstermen, gegenereerd door het onderwijsbeleid van de EU en geïmplementeerd door het Tuning Project. HOTNeV beoogt een tweeledig doel. Waar tot op heden Nederlandstalige equivalenten voor de Engelstalige terminologie vooral ad hoc werden … [Lees meer...] overHoger Onderwijs Terminologie in Nederland en Vlaanderen (HOTNeV)
Corpus Ondertitelde UvN-colleges (COUC)
Dit corpus bevat 57 ondertitelde colleges van de Universiteit van Nederland (UvN). Ondertitels werden toegevoegd aan bestaande video-opnames van colleges van de UvN. In tegenstelling tot gewone ondertitels zijn de ondertitels die in dit project werden gegenereerd een bijna 100% letterlijke weergave van de spraak zoals gesproken door de mensen in de opnames. Ze bevatten … [Lees meer...] overCorpus Ondertitelde UvN-colleges (COUC)
Meertalige Ondertiteldata 2BDutch
De ondertiteldata behorend bij de Nederlandstalige video’s op de website www.2BDutch.nl , vormt het product Meertalige Ondertiteldata 2BDutch. Op de website van 2BDutch staan video's met ondertitelingsmogelijkheid in verschillende talen. Met deze video's kunnen studenten Nederlands van alle niveaus hun luistervaardigheden oefenen en nieuwe Nederlandse woorden leren.De … [Lees meer...] overMeertalige Ondertiteldata 2BDutch