De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. The 5000 most frequent words from the … [Lees meer...] overFrequentielijsten corpora
Niet-commercieel
e-Lex
e-Lex is een lexicale databank van het Nederlands die uit een enkelwoordlexicon en een meerwoordlexicon bestaat. Het enkelwoordlexicon bevat circa 220.000 trefwoorden en meer dan 600.000 woordvormen, voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het meerwoordlexicon bevat meer dan … [Lees meer...] overe-Lex
Dutch Parallel Corpus (DPC)
Het DPC-corpus (Dutch Parallel Corpus) is een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans. Het is bidirectioneel - het Nederlands is zowel brontaal als doeltaal - en een gedeelte van het corpus is drietalig, waarbij Nederlandse teksten vertalingen hebben naar het Engels én het Frans. DPC is gealigneerd op zinsniveau en verrijkt … [Lees meer...] overDutch Parallel Corpus (DPC)
DuOMAn Subjectivity Lexicon
Het DuOMAn Subjectivity Lexicon bevat ongeveer 9000 werkwoorden, bijwoorden, substantieven en adjectieven waarvan aangegeven werd of ze een (zeer) negatieve, een neutrale of een (zeer) positieve gevoelswaarde hebben. The DuOMAn Subjectivity Lexicon contains about 9,000 verbs, adverbs, substantives and adjectives indicated as having a (very) negative, a neutral or a (very) … [Lees meer...] overDuOMAn Subjectivity Lexicon
DuELME
DuELME is een lexicon met ruim 5.000 Nederlandstalige meerwoordexpressies. Expressies met hetzelfde syntactische patroon zijn gegroepeerd in zogenoemde equivalence classes, wat het mogelijk maakt om het lexicon met minimale handmatige inspanning te integreren in een NLP-systeem. Het lexicon is ontwikkeld in het kader van het IRME-project. DuELME is a lexicon containing over … [Lees meer...] overDuELME