Productpagina

isiNdebele Genre Classification Corpus

Contains training and testing data for genre classification for isiNdebele. Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Cross-Lingual Genre Classification for Closely Related Languages (Prasa 2012) Eigenaar Trifonius Financier Department of Arts and Culture Licentiesoort Creative Commons Attribution 2.5 South … [Lees meer...] overisiNdebele Genre Classification Corpus

IFA Dialogue Video corpus

Het IFA Dialogue Video corpus corpus bestaat uit video- en geluidsopnamen van spontane dialogen tussen proefpersonen. Het bevat 24 video-opnames van spontane dialogen, waarvan er 20 zijn geannoteerd. 42 proefpersonen (14 mannelijk, 28 vrouwelijk) participeerden in dit onderzoek. The IFA Dialogue Video corpus consists of video and audio recordings of spontaneous dialogues … [Lees meer...] overIFA Dialogue Video corpus

IFA Corpus

Het IFA Corpus is een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk. Het corpus bevat in totaal zo'n 50.000 woorden die zijn gesegmenteerd op foneemniveau. The IFA Corpus is a phonetic research database consisting of Dutch speech data from 8 individuals; 4 male and 4 female. The corpus contains a total … [Lees meer...] overIFA Corpus

Frequentielijsten corpora

De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. Voor commercieel gebruik zie de commerciële … [Lees meer...] overFrequentielijsten corpora

e-Lex

e-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan … [Lees meer...] overe-Lex

« Vorige