• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar

INT Taalmaterialen

Bronnen, data en tools voor
taalkundig onderzoek binnen het
Nederlandse taalgebied.

U bent ingelogd.

MENUMENU
  • Nieuw
  • Alle taalmaterialen
  • Over deze website
  • Mijn taalmaterialen
  • Registreren
  • Inloggen
  • Zoeken

BasiLex-lexicon

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Aan de lemma's werd de volgende informatie toegevoegd: woordsoort, betekenis (bij ambigue woorden), lemmalengte, relatieve totale frequentie, absolute totale frequentie, geometrisch gemiddelde, de absolute frequentie per leerjaar en binnen het leerjaar per subcorpus, en de family size, family frequency, en orthographic neighborhood size per subcorpus.

Er worden ook extra frequentielijsten meegeleverd: een lijst met de 20.000 frequentste lemma's in het BasiLex-corpus met o.a. hun absolute totaalfrequenties en hun geometrisch gemiddelde (met en zonder uitsplitsing van de ambigue woorden) en een vergelijking tussen de 20.000 frequentste BasiLex-woorden en de 20.000 frequentste woorden uit een aantal SoNaR-subcorpora.
The Basilex Lexicon contains all lemmas from the Basilex Corpus with additional information.

Productdetails

Dataformaat xlsx (sql, ods, csv)
Doelpubliek Voornamelijk voor leerkrachten, makers van lesmaterialen en toetsen, schrijvers van kinderliteratuur, uitgevers en onderzoekers.
Eigenaar Radboud Universiteit
Financier NWO
Jaar 2015
Originele publicaties Tellings, A., Hulsbosch, M., Vermeer, A. & van den Bosch, A. (2015). BasiLex: an 11.5-million words corpus of Dutch texts written for children. Computational Linguistics in the Netherlands Journal 4, 191-208
Project WIC-CorD: a Dutch Written Input for Children Corpus, POS-tagged and lemmataized, with a derived lexicon tagged for frequency and linguistic characteristics
Refereren Tellings, A. E. J. M. (2015), BasiLex Lexicon (Version 1.0.1) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-k7
Talen Nederlands
Versie 1.0.1

Downloaddetails


Bestand
BP_BasilexLexicon_NC.zip
  • Aantal bestanden 1
  • Aantal downloads 77
  • Bestandsgrootte 53.25 KB
  • Datum plaatsing 17/07/2020
  • Laatst bijgewerkt 01/06/2021
  • Versie 1.0.1
Log in om te downloaden

Primaire Sidebar

Zoek op naam / tags

  • Disclaimer
  • Privacy Policy

© 2023 — Instituut voor de Nederlandse Taal — Contact: taalmaterialen@ivdnt.org

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Op deze website maken wij gebruik van cookies. Lees meerIk ga akkoord
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Altijd ingeschakeld
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
OPSLAAN & ACCEPTEREN
Naar de inhoud springen
Toolbar openen Toegankelijkheid

Toegankelijkheid

  • Vergroot tekstVergroot tekst
  • Verklein tekstVerklein tekst
  • GrijstintenGrijstinten
  • Hoog contrastHoog contrast
  • Negatief contrastNegatief contrast
  • Lichte achtergrondLichte achtergrond
  • Links onderstreeptLinks onderstreept
  • Leesbaar fontLeesbaar font
  • Terugzetten Terugzetten