GaLAHaD (Generating Linguistic Annotations for Historical Dutch) is ontwikkeld binnen het CLARIAH-PLUS-project. De applicatie biedt een flexibele omgeving voor automatische verrijking van historische teksten. Gebruikers kunnen automatisch woordsoort en lemma laten toevoegen door de machine en daarna de resultaten inspecteren, en de prestaties van verschillende tools analyseren … [Lees meer...] overGaLAHaD (Online)
Lemma's
CELEX-2 Dutch
CELEX is ontwikkeld in een samenwerkend verband tussen de Universiteit van Nijmegen, het Instituut voor de Nederlandse Lexicologie (tegenwoordig het Instituut voor de Nederlandse Taal - INT), het Max Planck Instituut voor Psycholinguïstiek in Nijmegen en het Instituut voor Perceptie Onderzoek te Eindhoven. De oorspronkelijke versie verscheen op cd-rom en bevatte ASCII-versies … [Lees meer...] overCELEX-2 Dutch
GiGaNT-Molex
Het GiGaNT-Molex-lexicon bevat Nederlands materiaal uit Nederland, Vlaanderen, de Antillen en Suriname afkomstig uit hedendaagse corpusteksten van het Instituut voor de Nederlandse Taal (INT). Alle lemmata en paradigmata zijn handmatig nagekeken en conform de officiële spelling. Versie 2.0 bevat 223.153 lemmata en 751.448 woordvormen met afbrekingen. Voor commercieel gebruik … [Lees meer...] overGiGaNT-Molex
Corpus Middelnederlands (Online)
Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse (literaire) rijm- en prozateksten uit de periode 1300-1550. De teksten zijn doorzoekbaar via een webapplicatie. The Corpus Middle Dutch is a collection of over 350 Middle Dutch (literary) rhyme and prose texts from the period 1300-1550. The texts can be searched via a web interface. Ga naar … [Lees meer...] overCorpus Middelnederlands (Online)
Corpus Hedendaags Nederlands – CHN (Online)
Het Corpus Hedendaags Nederlands (CHN) is een tekstverzameling met ongeveer 9,4 miljoen teksten uit boeken, blogs, kranten, tijdschriften en journaaluitzendingen uit Nederland, Vlaanderen, Suriname en de Nederlandse Antillen. Samen zijn deze teksten goed voor net geen 3 miljard woorden. Vanwege auteursrechten is dat corpus alleen toegankelijk met een CLARIN-account. Deze … [Lees meer...] overCorpus Hedendaags Nederlands – CHN (Online)