Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.
The Basilex corpus is an annotated collection of texts written for children in the age from four to twelve years.
Corpus
BasiLex-corpus
Brieven als Buit – Gouden Standaard
De circa 1000 met hoofdwoordsoort en modern lemma verrijkte bronbestanden van het Brieven als Buit-programma, geleid door prof. dr. M.J. van der Wal.
Letters as Loot – Gold Standard contains the 1000 or so source files from the Letters as Loot program (directed by Prof. Dr. M.J. van der Wal), each enriched with main part-of-speech and modern lemma.
AUTONOMATA-POI-corpus
Het corpus is een database van 800 voorgelezen points of interest (POI’s) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc.
A corpus of 800 pronounced points of interest from the Netherlands and Belgium containing names of restaurants, camping sites, cafe’s, etc.