CombiLex is een lijst van lemma's en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508. CombiLex is a list of lemmata and word forms with no added linguistic information. … [Lees meer...] overCombiLex
Productpagina
CombiLex Commercieel
CombiLex is een lijst van woorden en woordvormen zonder toegevoegde taalkundige informatie. De woordenlijst is gebaseerd op drie bronnen: BWNT05, e-Lex 1.0, RBN 2.0. Het aantal (uniek gesorteerde) lemma's in CombiLex is ruim 213.000. Het totale aantal van lemma's en woordvormen is 442.508. CombiLex is a list of lemmata and word forms with no added linguistic information. … [Lees meer...] overCombiLex Commercieel
Children’s Oral Reading Corpus (CHOREC)
Het CHOREC-spraakcorpus (Children's Oral Reading Corpus) is een verzameling van 130 uur spraak, afkomstig van 400 Vlaamse kinderen die teksten en woordenlijsten voorlezen voor leesvaardigheidsontwikkeling en -toetsen. In het corpus zijn specifieke annotaties zoals leesstrategie en soorten leesfouten opgenomen. A collection of 130 hours of speech by children (reading … [Lees meer...] overChildren’s Oral Reading Corpus (CHOREC)
isiNdebele Custom Dictionary for Government Domain
This custom dictionary was developed in a spelling checker project for the Department of Arts and Culture and it contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiNdebele. Productdetails Annotaties txt Documentatie Project report on evaluation and acceptance … [Lees meer...] overisiNdebele Custom Dictionary for Government Domain
INT Historische Woordenlijst
De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper. Productdetails Dataformaat txt Eigenaar INT Jaar 2012 Project IMPACT: Improving Access to … [Lees meer...] overINT Historische Woordenlijst