The Dutch Corpus of Contemporary and late Modern Periodicals (Dutch C-CLAMP) is een corpus dat bestaat uit een verzameling artikelen uit 13 culturele of literaire tijdschriften die in Vlaanderen en Nederland zijn gepubliceerd. Het is een historisch corpus met teksten uit de periode tussen 1837 en 1999. Versie 2.0 van het corpus is een optimalisatie van het oorspronkelijke Dutch C-CLAMP-corpus, wat heeft geresulteerd in een opgeschoond en opnieuw ge-POS-tagd en gelemmatiseerd corpus.
The Dutch Corpus of Contemporary and late Modern Periodicals (Dutch C-CLAMP) is a corpus that consists of a collection of articles from 13 cultural or literary periodicals published in Flanders and The Netherlands. It is a historical corpus, containing texts from the period between 1837 and 1999. Version 2.0 of the corpus is an optimization of the original Dutch C-CLAMP corpus which resulted in a cleaned-up and completely re-POS-tagged and re-lemmatized corpus.
De bronteksten in het corpus zijn afkomstig uit de DBNL, een dienst van de KB. Op een deel van de bronteksten rust auteursecht. Er moet dan ook een overeenkomst met de KB afgesloten worden voor het gebruik van die brondata. Indien u hieronder akkoord gaat met de licentie voor Dutch C-CLAMP m.u.v. de bronteksten (met name de taalkundige verrijkingen, de metadata, etc.), kunt u de verdere bestelinstructies downloaden.
The source texts in the corpus originate from the DBNL, a service provided by the KB. Some of these texts are protected by copyright, which means that an agreement with the KB is required in order to use them. If you agree to the licence for Dutch C-CLAMP – excluding the source texts (i.e. the linguistic enrichments, metadata, etc.) - see below, you can download the additional ordering instructions.
Productdetails
| Dataformaat | .txt |
| Jaar | 2025 |
| Eigenaars | KB; KU Leuven |
| Documentatie | Thesis: Optimization of the Dutch Corpus of Contemporary and late Modern Periodicals (C-CLAMP) |
| Refereren | Piersoul, Jozefien, Robbert De Troij & Freek Van de Velde. 2021. ‘150 years of written Dutch: the construction of the Dutch Corpus of Contemporary and Late Modern Periodicals’. Nederlandse Taalkunde 26(3): 339-362. Dutch C-CLAMP (Version 2.0) (2025) [Dataset] Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a3-d3 |
| Talen | Nederlands |
| Omvang | Ca. 173 miljoen tokens |
| Versie | 2.0 |
Downloaddetails
| Bestand | |
|---|---|
| Bestelinstructies_Dutch_C-CLAMP.pdf |
- Aantal bestanden 1
- Aantal downloads 3
- Bestandsgrootte 806.23 KB
- Datum plaatsing 17/10/2025
- Laatst bijgewerkt 27/11/2025
- Versie