Het IFA Corpus is een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk. Het corpus bevat in totaal zo'n 50.000 woorden die zijn gesegmenteerd op foneemniveau. The IFA Corpus is a phonetic research database consisting of Dutch speech data from 8 individuals; 4 male and 4 female. The corpus contains a total … [Lees meer...] overIFA Corpus
Niet-commercieel
Frequentielijsten corpora
De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. The 5000 most frequent words from the … [Lees meer...] overFrequentielijsten corpora
e-Lex
e-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan … [Lees meer...] overe-Lex
Dutch Parallel Corpus (DPC)
Het DPC-corpus (Dutch Parallel Corpus) is een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans. Het is bidirectioneel - het Nederlands is zowel brontaal als doeltaal - en een gedeelte van het corpus is drietalig, waarbij Nederlandse teksten vertalingen hebben naar het Engels én het Frans. DPC is gealigneerd op zinsniveau en verrijkt … [Lees meer...] overDutch Parallel Corpus (DPC)
DuOMAn Subjectivity Lexicon
Het DuOMAn Subjectivity Lexicon bevat ongeveer 9000 werkwoorden, bijwoorden, substantieven en adjectieven waarvan aangegeven werd of ze een (zeer) negatieve, een neutrale of een (zeer) positieve gevoelswaarde hebben. The DuOMAn Subjectivity Lexicon contains about 9,000 verbs, adverbs, substantives and adjectives indicated as having a (very) negative, a neutral or a (very) … [Lees meer...] overDuOMAn Subjectivity Lexicon