Het Corpus Gysseling dat hier ter beschikking wordt gesteld is de verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek. Het is de digitale uitgave, verrijkt met woordsoort en lemma, van het dertiende-eeuwse materiaal uit het Corpus van Middelnederlandse teksten (tot en met het jaar 1300), uitgegeven in … [Lees meer...] overCorpus Gysseling (Data)
Productpagina
Corpus Gesproken Nederlands (CGN)
Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica en frequentielijsten behoren ook tot … [Lees meer...] overCorpus Gesproken Nederlands (CGN)
Corpus Gesproken Nederlands (CGN) Commercieel
Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica en frequentielijsten behoren ook tot … [Lees meer...] overCorpus Gesproken Nederlands (CGN) Commercieel
COREA-coreferentiecorpus
Het COREA-coreferentiecorpus (circa 150.000 woorden) bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn. De teksten bestaan uit krantenartikelen (D-Coi), getranscribeerde spraak (CGN) en lemma's uit de Spectrum (Winkler Prins) Medische Encyclopedie. Voor commercieel gebruik zie de commerciële productpagina. The COREA coreference … [Lees meer...] overCOREA-coreferentiecorpus
CombiLex
CombiLex is een lijst van lemma's en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508. Voor commercieel gebruik zie de commerciële productpagina. CombiLex is a list of … [Lees meer...] overCombiLex