De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties Commercieel
Commercieel
BasiScript-lexicon Commercieel
Het BasiScript-corpus bestaat uit 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool. Het corpus bevat longitudinale data verzameld over drie achtereenvolgende jaren (najaar 2012 - voorjaar 2015) en het is ontworpen om zowel de educatieve diversiteit (type school) als geografische regio's van Nederland te kunnen vergelijken. De … [Lees meer...] overBasiScript-lexicon Commercieel
BasiScript-corpus Commercieel
Het BasiScript-corpus bestaat uit 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool. Het corpus bevat longitudinale data verzameld over drie achtereenvolgende jaren (najaar 2012 - voorjaar 2015) en het is ontworpen om zowel de educatieve diversiteit (type school) als geografische regio's van Nederland te kunnen vergelijken. De … [Lees meer...] overBasiScript-corpus Commercieel
BasiLex-lexicon Commercieel
Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Aan de lemma's werd de volgende informatie toegevoegd: woordsoort, betekenis (bij ambigue woorden), lemmalengte, relatieve totale frequentie, absolute totale frequentie, geometrisch gemiddelde, de … [Lees meer...] overBasiLex-lexicon Commercieel
BasiLex-corpus Commercieel
Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Het corpus bevat 13,5 miljoen tokens, waarvan 11,5 miljoen woorden. De tokens komen voor ongeveer 40% uit educatieve materialen, 40% uit kinderliteratuur en 20% uit media. The BasiLex corpus is an annotated collection of texts written for primary school-aged … [Lees meer...] overBasiLex-corpus Commercieel