Textlens is een online dashboard voor tekstverwerking, dat de allernieuwste linguïstische verwerkingstools zoals spaCy en Stanza biedt voor taken als automatische tokenisatie, lemmatisering, tagging, named entity recognition en afhankelijkheidsanalyse voor Nederlands, Engels, Frans en Duits. Dit taalmateriaal is enkel toegankelijk met een CLARIN-login. Textlens is an … [Lees meer...] overTextlens (Online)
Part of Speech
GaLAHaD (Online)
GaLAHaD (Generating Linguistic Annotations for Historical Dutch) is ontwikkeld binnen het CLARIAH-PLUS-project. De applicatie biedt een flexibele omgeving voor automatische verrijking van historische teksten. Gebruikers kunnen automatisch woordsoort en lemma laten toevoegen door de machine en daarna de resultaten inspecteren, en de prestaties van verschillende tools analyseren … [Lees meer...] overGaLAHaD (Online)
Lassy Klein-corpus
Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd. Het … [Lees meer...] overLassy Klein-corpus
Corpus Middelnederlands (Online)
Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse (literaire) rijm- en prozateksten uit de periode 1300-1550. De teksten zijn doorzoekbaar via een webapplicatie. The Corpus Middle Dutch is a collection of over 350 Middle Dutch (literary) rhyme and prose texts from the period 1300-1550. The texts can be searched via a web interface. Ga naar … [Lees meer...] overCorpus Middelnederlands (Online)
Corpus Hedendaags Nederlands – CHN (Online)
Het Corpus Hedendaags Nederlands (CHN) is een tekstverzameling met ongeveer 9,4 miljoen teksten uit boeken, blogs, kranten, tijdschriften en journaaluitzendingen uit Nederland, Vlaanderen, Suriname en de Nederlandse Antillen. Samen zijn deze teksten goed voor net geen 3 miljard woorden. Vanwege auteursrechten is dat corpus alleen toegankelijk met een CLARIN-account. Deze … [Lees meer...] overCorpus Hedendaags Nederlands – CHN (Online)