Het BasiScript-corpus is een geannoteerde verzameling van teksten geschreven door kinderen in de basisschoolleeftijd. Het BasiScript-lexicon is afgeleid van dat corpus.
The Basilex Corpus is an annotated collection of texts written by children in primary school. The BasiScript Lexicon is derived from this corpus.
Orthografie
BasiScript-corpus Commercieel
BasiScript-corpus
Brieven als Buit – Gouden Standaard
De circa 1000 met hoofdwoordsoort en modern lemma verrijkte bronbestanden van het Brieven als Buit-programma, geleid door prof. dr. M.J. van der Wal.
Letters as Loot – Gold Standard contains the 1000 or so source files from the Letters as Loot program (directed by Prof. Dr. M.J. van der Wal), each enriched with main part-of-speech and modern lemma.
AUTONOMATA-POI-corpus
Het corpus is een database van 800 voorgelezen points of interest (POI’s) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc.
A corpus of 800 pronounced points of interest from the Netherlands and Belgium containing names of restaurants, camping sites, cafe’s, etc.