Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus Commercieel
Productpagina
CHN N-grams Commercieel
N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten tijdschriften, journaaluitzendingen en juridisch materiaal. CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende … [Lees meer...] overCHN N-grams Commercieel
CHN N-grams
N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten, tijdschriften, journaaluitzendingen en juridisch materiaal. CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende … [Lees meer...] overCHN N-grams
CGN-annotaties Commercieel
De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties Commercieel
CGN-annotaties
De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties