Het Corpus Pathologische en Normale Spraak (COPAS) bevat opnames van de DIA (Dutch Intelligibility Assessment). Daarnaast bevat het ook voorgelezen tekstpassages, afzonderlijke zinnen en spontane spraak van een deel van de sprekers. Het corpus bevat opnames van bijna 200 Vlaamse pathologische sprekers (= sprekers met een hoorbare stoornis) en 122 Vlaamse controlesprekers. De … [Lees meer...] overCorpus Pathologische en Normale Spraak (COPAS)
Niet-commercieel
Corpus Middelnederlands (Data)
Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse (literaire) rijm- en prozateksten uit de periode 1300-1550. Deze zijn in TEI gecodeerd (oorspronkelijk gepubliceerd op de cd-rom Middelnederlands). Voor commerciële toepassingen, neem contact op met servicedesk@ivdnt.org. The Corpus Middle Dutch is a collection of over 350 Middle Dutch (literary) … [Lees meer...] overCorpus Middelnederlands (Data)
Corpus Gysseling (Data)
Het Corpus Gysseling dat hier ter beschikking wordt gesteld is de verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek. Het is de digitale uitgave, verrijkt met woordsoort en lemma, van het dertiende-eeuwse materiaal uit het Corpus van Middelnederlandse teksten (tot en met het jaar 1300), uitgegeven in … [Lees meer...] overCorpus Gysseling (Data)
Corpus Gesproken Nederlands (CGN)
Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaagse Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (syntactisch, POS-tags). Metadata, lexica en frequentielijsten behoren ook tot … [Lees meer...] overCorpus Gesproken Nederlands (CGN)
COREA-coreferentiecorpus
Het COREA-coreferentiecorpus (circa 150.000 woorden) bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn. De teksten bestaan uit krantenartikelen (D-Coi), getranscribeerde spraak (CGN) en lemma's uit de Spectrum (Winkler Prins) Medische Encyclopedie. Voor commercieel gebruik zie de commerciële productpagina. The COREA coreference … [Lees meer...] overCOREA-coreferentiecorpus