De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper. Productdetails Dataformaat txt Eigenaar INT Jaar 2012 Project IMPACT: Improving Access to … [Lees meer...] overINT Historische Woordenlijst
Lexicon
GiGaNT-Molex Commercieel
Het GiGaNT-Molex-lexicon bevat Nederlands materiaal uit Nederland, Vlaanderen, de Antillen en Suriname afkomstig uit hedendaagse corpusteksten van het Instituut voor de Nederlandse Taal (INT). Alle lemmata en paradigmata zijn handmatig nagekeken en conform de officiële spelling. Versie 2.0 bevat nu 223.153 lemmata en 751.448 woordvormen met afbrekingen. The GiGaNT-Molex … [Lees meer...] overGiGaNT-Molex Commercieel
Frequentielijsten corpora Commercieel
De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het Corpus Gesproken Nederlands, het Algemeen Nederlands Woordenboekcorpus, het Eindhoven-corpus, het D-Coi-corpus en het SoNaR-corpus. Voor vrijwel elk van deze producten is er zowel een lemmafrequentielijst als een typefrequentielijst beschikbaar. The 5000 most frequent words from the … [Lees meer...] overFrequentielijsten corpora Commercieel
Etymologisch Woordenboek van het Nederlands (EWN)
Een wetenschappelijk etymologisch woordenboek voor het moderne bovenregionale Nederlands. A scientific etymological dictionary of modern, superregional Dutch. Ga naar website Details … [Lees meer...] overEtymologisch Woordenboek van het Nederlands (EWN)
Etymologiebank
De Etymologiebank biedt alle belangrijke etymologische publicaties van het Nederlands op woordniveau aan op één centraal punt (data geleverd door het INT). Etymologiebank presents all important etymological publications on Dutch words in one place (data have been supplied by the Dutch Language Institute). Ga naar website Details … [Lees meer...] overEtymologiebank