Het WAI-NOT Ccorpus bestaat uit 874 krantenartikels, afkomstig uit de WAI-NOT-krant. De artikels zijn opgesteld in eenvoudig te lezen Nederlands en zijn afkomstig uit de periode 2009-2021. Het corpus bevat ongeveer 75.000 woorden. De artikels zijn beschikbaar als xml-bestanden met daarin een titel, de artikeltekst en een datum. Die datum kan de oorspronkelijke … [Lees meer...] overWAI-NOT Corpus
Corpus
Lassy Klein-corpus
Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Brieven als Buit (Online)
Ongeveer 40.000 Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw hebben eeuwenlang onder het stof gelegen in Britse archieven. Deze zogeheten Sailing Letters zijn niet alleen vanuit het buitenland door zeelieden en anderen naar het thuisfront verstuurd. Ook vanuit Nederland bleven echtgenotes, ouders, kinderen en andere familieleden met briefverkeer in … [Lees meer...] overBrieven als Buit (Online)
Brieven als Buit-2 (Online)
Ongeveer 40.000 Nederlandse brieven uit de tweede helft van de 17e tot het begin van de 19e eeuw hebben eeuwenlang stof verzameld in Britse archieven. Ze werden naar huis gestuurd door zeelieden en anderen uit het buitenland, maar ook andersom door achterblijvers die contact wilden houden met hun geliefden. Veel brieven bereikten hun bestemming niet: ze werden als buit … [Lees meer...] overBrieven als Buit-2 (Online)
Corpus Nederlandse Gebarentaal (CNGT)
Dit product is nog niet beschikbaar. This product is not yet available. Productdetails Dataformaat Jaar Opdrachtgever Project Refereren Corpus Nederlandse Gebarentaal (Version 1.0) (202?) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-u5 Talen Vlaamse … [Lees meer...] overCorpus Nederlandse Gebarentaal (CNGT)