Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, … [Lees meer...] overAUTONOMATA-POI-corpus
Productpagina
AUTONOMATA-namencorpus Commercieel
Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel. The AUTONOMATA Spoken Names Corpus is a database with in total about 5000 read first names, surnames, straat names, city names and check words. The corpus consists of a … [Lees meer...] overAUTONOMATA-namencorpus Commercieel
AUTONOMATA-namencorpus
Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel. Voor commercieel gebruik zie de commerciële productpagina. The AUTONOMATA Spoken Names Corpus is a database with in total about 5000 read first names, surnames, straat … [Lees meer...] overAUTONOMATA-namencorpus
Afrikaans Genre Classification Corpus
This language resource contains training and testing data for genre classification for Afrikaans. The available classes are: fictional text (drama, prose and poetry) and non-fictional text (neutral, subjective and objective). Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Snyman, D., van Huyssteen, G. B., & Daelemans, W. 2012. … [Lees meer...] overAfrikaans Genre Classification Corpus
Afrikaans Custom Dictionary for Government Domain
This custom dictionary was developed in a spelling checker project for the Department of Arts and Culture and it contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of the language. Productdetails Annotaties Alphabetic list, one word(token) per line, Text, ANSI … [Lees meer...] overAfrikaans Custom Dictionary for Government Domain