CombiLex is een lijst van woorden en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508. CombiLex is a list of lemmata and word forms with no added linguistic information. … [Lees meer...] overCombiLex Commercieel
Lexicon
isiNdebele Custom Dictionary for Government Domain
This custom dictionary was developed in a spelling checker project for the Department of Arts and Culture and it contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiNdebele. Productdetails Annotaties txt Documentatie Project report on evaluation and acceptance … [Lees meer...] overisiNdebele Custom Dictionary for Government Domain
INT Historische Woordenlijst
De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper. The INT Historische Woordenlijst consists of 2 lists, each containing about 500,000 historical word forms for the purpose … [Lees meer...] overINT Historische Woordenlijst
GiGaNT-Molex Commercieel
Het GiGaNT-Molex-lexicon bevat Nederlands materiaal uit Nederland, Vlaanderen, de Antillen en Suriname afkomstig uit hedendaagse corpusteksten van het Instituut voor de Nederlandse Taal (INT). Alle lemmata en paradigmata zijn handmatig nagekeken en conform de officiële spelling. Versie 2.0 bevat nu 223.153 lemmata en 751.448 woordvormen met afbrekingen. The GiGaNT-Molex … [Lees meer...] overGiGaNT-Molex Commercieel
Frequentielijsten corpora Commercieel
De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. The 5000 most frequent words from the … [Lees meer...] overFrequentielijsten corpora Commercieel