Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.
Aan de lemma's werd de volgende informatie toegevoegd: woordsoort, betekenis (bij ambigue woorden), lemmalengte, relatieve totale frequentie, absolute totale frequentie, geometrisch gemiddelde, de absolute frequentie per leerjaar en binnen het leerjaar per subcorpus, en de family size, family frequency, en orthographic neighborhood size per subcorpus.
Er worden ook extra frequentielijsten meegeleverd: een lijst met de 20.000 frequentste lemma's in het BasiLex-corpus met o.a. hun absolute totaalfrequenties en hun geometrisch gemiddelde (met en zonder uitsplitsing van de ambigue woorden) en een vergelijking tussen de 20.000 frequentste BasiLex-woorden en de 20.000 frequentste woorden uit een aantal SoNaR-subcorpora.
The Basilex Lexicon contains all lemmas from the Basilex Corpus with additional information.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Dataformaat | xlsx (sql, ods, csv) |
Doelpubliek | Voornamelijk voor leerkrachten, makers van lesmaterialen en toetsen, schrijvers van kinderliteratuur, uitgevers en onderzoekers. |
Eigenaar | Radboud Universiteit |
Financier | NWO |
Jaar | 2015 |
Originele publicaties | Tellings, A., Hulsbosch, M., Vermeer, A. & van den Bosch, A. (2015). BasiLex: an 11.5-million words corpus of Dutch texts written for children. Computational Linguistics in the Netherlands Journal 4, 191-208 |
Project | WIC-CorD: a Dutch Written Input for Children Corpus, POS-tagged and lemmataized, with a derived lexicon tagged for frequency and linguistic characteristics |
Refereren | Tellings, A. E. J. M. (2015), BasiLex-lexicon Commercieel (Version 1.0.1) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-d8 |
Talen | Nederlands |
Versie | 1.0.1 |
Downloaddetails
Bestand | |
---|---|
BP_BasiLex-lexicon_C.zip |
- Aantal bestanden 1
- Aantal downloads 57
- Bestandsgrootte 52.78 KB
- Datum plaatsing 17/07/2020
- Laatst bijgewerkt 15/10/2024
- Versie 1.0.1