Een verzameling van al het overgebleven Nederlandse woordmateriaal uit de periode 475-1200. A collection of all the surviving lexical material from the period between 475 and 1200. This application has been deprecated because of security concerns. For the new version of the application, go to
Corpus Hedendaags Nederlands (CHN)
Een tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal (1814-2013). Het corpus is een samenvoeging van de oude 5, 27 en 38 Miljoen Woorden Corpora en het PAROLE-corpus, aangevuld met krantenmateriaal. Alleen toegankelijk met een CLARIN-account. A collection of over 800,000 texts taken from newspapers,
Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen. De COREA-webservice is niet langer beschikbaar. A system to solve coreferential relations between nominal constituents in texts. The COREA webservice is no longer available. Productdetails Financier KNAW,
Brieven als Buit
Approximately 40,000 Dutch letters from the second half of the 17th to the early 19th century have been gathering dust for centuries in British archives. They were sent home by sailors and others from abroad but also vice versa by those staying behind who needed to keep in touch with their loved ones. Many letters did not reach their destinations: they were taken as loot by
Annotated Corpora for Term Extraction Research (ACTER)
ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie). Deze versie is vervangen door een nieuwere: Versie 1.5 ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption,