Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van variaties in persoonsnamen. De clustering van namen onder een standaard is gebaseerd op bestaande kennis van varianten en op spellingsovereenkomst. Er is gebruik is gemaakt van zowel automatische als handmatige gegevensverwerking. Praktische bruikbaarheid van een standaard (met verschillende kwaliteitsniveaus) had de voorkeur boven een etymologisch verantwoorde afleiding die vaak niet te maken is.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Dataformaat | tsv, sql |
Documentatie | NAMES Manual |
Eigenaar | |
Financier | NWO|KNAW |
Jaar | 2020 |
Opdrachtgever | CLARIAH |
Project | NAMES |
Projectwebsite | CLARIAH pilot NAMES |
Refereren | NAMES Corpus (Version 1.1) (2020) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-r6 |
Software | MySQL of equivalent |
Talen | Nederlands |
Versie | 1.1 |
Downloaddetails
Bestand | |
---|---|
BP_NAMES_Corpus_C.zip |
- Aantal bestanden 1
- Aantal downloads 5
- Bestandsgrootte 51.35 KB
- Datum plaatsing 02/09/2020
- Laatst bijgewerkt 14/06/2024
- Versie 1.1