Het CHOREC-spraakcorpus (Children's Oral Reading Corpus) is een verzameling van 130 uur spraak, afkomstig van 400 Vlaamse kinderen die teksten en woordenlijsten voorlezen voor leesvaardigheidsontwikkeling en -toetsen. In het corpus zijn specifieke annotaties zoals leesstrategie en soorten leesfouten opgenomen. The CHOREC speech corpus (Children's Oral Reading Corpus) is a … [Lees meer...] overChildren’s Oral Reading Corpus (CHOREC)
Productpagina
isiNdebele Custom Dictionary for Government Domain
This custom dictionary was developed in a spelling checker project for the Department of Arts and Culture and it contains an alphabetic list of words which are exclusive to the government domain or which are not part of the official orthography of isiNdebele. Productdetails Annotaties txt Documentatie Project report on evaluation and acceptance … [Lees meer...] overisiNdebele Custom Dictionary for Government Domain
INT Historische Woordenlijst
De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper. The INT Historische Woordenlijst consists of 2 lists, each containing about 500,000 historical word forms for the purpose … [Lees meer...] overINT Historische Woordenlijst
Hulk / Keurmerk Spelling
HulK / Keurmerk Spelling: keurmerk voor producten die de regels en principes van de officiële spelling van de Taalunie volgen. Certification mark for products written in compliance with the official spelling rules and principles formulated by the Dutch Language Union. Ga naar website Details … [Lees meer...] overHulk / Keurmerk Spelling
GiGaNT-Molex Commercieel
Het GiGaNT-Molex-lexicon bevat Nederlands materiaal uit Nederland, Vlaanderen, de Antillen en Suriname afkomstig uit hedendaagse corpusteksten van het Instituut voor de Nederlandse Taal (INT). Alle lemmata en paradigmata zijn handmatig nagekeken en conform de officiële spelling. Versie 2.0 bevat nu 223.153 lemmata en 751.448 woordvormen met afbrekingen. The GiGaNT-Molex … [Lees meer...] overGiGaNT-Molex Commercieel