BasiScript is een corpus met 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool. Het corpus bevat longitudinale data verzameld over drie achtereenvolgende jaren (najaar 2012 - voorjaar 2015). Het BasiScript-corpus is ontworpen om zowel de educatieve diversiteit (type school) als de geografische regio's van Nederland te kunnen … [Lees meer...] overBasiScript-corpus Commercieel
Commercieel
BasiLex-lexicon Commercieel
Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Aan de lemma's werd de volgende informatie toegevoegd: woordsoort, betekenis (bij ambigue woorden), lemmalengte, relatieve totale frequentie, absolute totale frequentie, geometrisch gemiddelde, de … [Lees meer...] overBasiLex-lexicon Commercieel
BasiLex-corpus Commercieel
Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Het corpus bevat 13,5 miljoen tokens, waarvan 11,5 miljoen woorden. De tokens komen voor ongeveer 40% uit educatieve materialen, 40% uit kinderliteratuur en 20% uit media. The Basilex corpus is an annotated collection of texts written for children in the age … [Lees meer...] overBasiLex-corpus Commercieel
AUTONOMATA-namencorpus Commercieel
Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel. A database with in total about 5000 read first names, surnames, straat names, city names and check words. Dit product is gratis. Maar het is wel noodzakelijk … [Lees meer...] overAUTONOMATA-namencorpus Commercieel