Het BasiScript-corpus bestaat uit 9 miljoen woorden geschreven tekst geproduceerd door leerlingen van de Nederlandse basisschool. Het corpus bevat longitudinale data verzameld over drie achtereenvolgende jaren (najaar 2012 - voorjaar 2015) en het is ontworpen om zowel de educatieve diversiteit (type school) als geografische regio's van Nederland te kunnen vergelijken. De … [Lees meer...] overBasiScript-corpus
Niet-commercieel
BasiLex-lexicon
Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus. Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Aan de lemma's werd de volgende informatie toegevoegd: woordsoort, betekenis (bij ambigue woorden), lemmalengte, relatieve totale frequentie, absolute totale frequentie, geometrisch gemiddelde, de … [Lees meer...] overBasiLex-lexicon
BasiLex-corpus
Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd. Het corpus bevat 13,5 miljoen tokens, waarvan 11,5 miljoen woorden. De tokens komen voor ongeveer 40% uit educatieve materialen, 40% uit kinderliteratuur en 20% uit media. Voor commercieel gebruik zie de commerciële productpagina. The BasiLex corpus is an … [Lees meer...] overBasiLex-corpus
AUTONOMATA-POI-demo
Een demo van een spraakherkenner voor POI's (points of interest). Deze demo herkent overnachtingsadressen en eetgelegenheden in enkele grote steden (o.a. Amsterdam, Antwerpen, Gent, Rotterdam). A demo of speech recognision for POI's (points of interest). This demo recognises hotels and restuarants in a number of large cities (a.o. Amsterdam, Antwerp, Ghent, … [Lees meer...] overAUTONOMATA-POI-demo
AUTONOMATA-POI-corpus
Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, … [Lees meer...] overAUTONOMATA-POI-corpus