Het materiaal Brieven als Buit - Gouden Standaard bestaat uit ca. 1000 met hoofdwoordsoort en modern lemma verrijkte bestanden van het Brieven als Buit-programma, geleid door Prof. Dr. M.J. van der Wal. De transcriptie is gemaakt in het kader van het project aan de Universiteit Leiden. De verrijking is gebeurd door het Instituut voor de Nederlandse Taal. The language … [Lees meer...] overBrieven als Buit – Gouden Standaard
Corpus
AUTONOMATA-POI-corpus
Het AUTONOMATA-POI-corpus is een database van 800 voorgelezen points of interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc. Het corpus bevat opnames van 80 sprekers met verschillende taalachtergronden, in totaal 16.000 geluidsbestanden. Daarnaast werden sprekers in staat gesteld meerdere pogingen voor een POI op te nemen, … [Lees meer...] overAUTONOMATA-POI-corpus
AUTONOMATA-namencorpus Commercieel
Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel. The AUTONOMATA Spoken Names Corpus is a database with in total about 5000 read first names, surnames, straat names, city names and check words. The corpus consists of a … [Lees meer...] overAUTONOMATA-namencorpus Commercieel
AUTONOMATA-namencorpus
Het AUTONOMATA-namencorpus is een database van in totaal circa 5000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden. Het corpus bestaat uit een Nederlands en een Vlaams deel. Voor commercieel gebruik zie de commerciële productpagina. The AUTONOMATA Spoken Names Corpus is a database with in total about 5000 read first names, surnames, straat … [Lees meer...] overAUTONOMATA-namencorpus
Afrikaans Genre Classification Corpus
This language resource contains training and testing data for genre classification for Afrikaans. The available classes are: fictional text (drama, prose and poetry) and non-fictional text (neutral, subjective and objective). Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Snyman, D., van Huyssteen, G. B., & Daelemans, W. 2012. … [Lees meer...] overAfrikaans Genre Classification Corpus