Het Couranten Corpus bevat dertien zeventiende-eeuwse Nederlandse kranten uit de periode 1619-1700 die momenteel op Delpher.nl beschikbaar zijn. Er zijn 109.532 artikelen in te vinden met een totaal van 18.926.425 woorden. Het corpus is doorzoekbaar via een webapplicatie. De verschillen tussen versie 1.0 en versie 2.0 zijn: de gebruikersinterface bevat meer … [Lees meer...] overCouranten Corpus (Online)
Corpus
Dutch Renaissance Poetry Corpus
Het Dutch Renaissance Poetry Corpus bevat alexandrijnen en jambische pentameters geschreven door een selectie van Nederlandse Renaissancedichters (eind 16de en 17de eeuw). De creatie en annotatie maakten deel uit van een promotieproject aan het Meertens Instituut (https://www.meertens.knaw.nl) dat werd gefinancierd door de Koninklijke Nederlandse Akademie van Wetenschappen … [Lees meer...] overDutch Renaissance Poetry Corpus
GCND GrETEL (Online)
Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is een taalkundig geannoteerd corpus, gebaseerd op een unieke collectie van dialectopnames (Stemmen uit het Verleden) uit 768 verschillende plaatsen in België, het noorden van Frankrijk en het zuiden van Nederland bij in het algemeen weinig mobiele en laagopgeleide sprekers geboren rond 1900. Twee Gentse … [Lees meer...] overGCND GrETEL (Online)
Historical Corpus of Dutch – HCD (Online)
Het Historisch Corpus van het Nederlands (HCD) is een diachronisch, regionaal gebalanceerd corpus van verschillende genres geschreven Nederlands. Het corpus werd gemaakt met de bedoeling een belangrijke leemte op te vullen in de onderzoeksinfrastructuur voor historisch Nederlands, die lange tijd geen evenwichtig corpus heeft gehad met data uit alle eeuwen en uit verschillende … [Lees meer...] overHistorical Corpus of Dutch – HCD (Online)
Corpus Oudfries (Online)
Het Corpus Oudfries bevat een grote aantal woorden van de Oudfriese taal van ca. 1200-1550, die door Rita van de Poel zijn gelemmatiseerd en van PoS-markeringen voorzien als onderdeel van haar promotieonderzoek. Het corpus kan doorzocht worden op drie linguïstische niveaus: woorden (zoals voorkomend in de tekstgetuige), lemmata en/of part-of-speech. Het corpus is ook verrijkt … [Lees meer...] overCorpus Oudfries (Online)