This custom dictionary was developed in a spelling checker project for the Department of Arts and Culture and it contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiXhosa. Productdetails Annotaties Alphabetic list, one word(token) per line, Text, ANSI … [Lees meer...] overisiXhosa Custom Dictionary for Government Domain
Productpagina
isiNdebele Genre Classification Corpus
Contains training and testing data for genre classification for isiNdebele. Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Cross-Lingual Genre Classification for Closely Related Languages (Prasa 2012) Eigenaar Trifonius Financier Department of Arts and Culture Licentiesoort Creative Commons Attribution 2.5 South … [Lees meer...] overisiNdebele Genre Classification Corpus
IFA Dialogue Video corpus
Het IFA Dialogue Video corpus corpus bestaat uit video- en geluidsopnamen van spontane dialogen tussen proefpersonen. Het bevat 24 video-opnames van spontane dialogen, waarvan er 20 zijn geannoteerd. 42 proefpersonen (14 mannelijk, 28 vrouwelijk) participeerden in dit onderzoek. The IFA Dialogue Video corpus consists of video and audio recordings of spontaneous dialogues … [Lees meer...] overIFA Dialogue Video corpus
IFA Corpus
Het IFA Corpus is een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk. Het corpus bevat in totaal zo'n 50.000 woorden die zijn gesegmenteerd op foneemniveau. The IFA Corpus is a phonetic research database consisting of Dutch speech data from 8 individuals; 4 male and 4 female. The corpus contains a total … [Lees meer...] overIFA Corpus
Frequentielijsten corpora
De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. The 5000 most frequent words from the … [Lees meer...] overFrequentielijsten corpora