Een belangrijk onderdeel van het CLARIAH-project is het aanbieden van de mogelijkheid om verschillende dataverzamelingen gelijktijdig te doorzoeken: "Federated Content Search". Het INT heeft een aantal lexica geconverteerd naar RDF en een interface ontwikkeld om deze eenvoudig samen te doorzoeken. An important part of the CLARIAH project is to offer the option to … [Lees meer...] overFederated Search Lexica (Online)
Productpagina
Diachroon seMantisch lexicon van de Nederlandse Taal – DiaMaNT (Online)
DiaMaNT (Diachroon seMantisch lexicon van de Nederlandse Taal) is een computationeel semantisch lexicon dat diachrone semantische informatie biedt. Het is gebouwd als laag bovenop GiGaNT, door betekenisinformatie toe te voegen. Het lexicon legt relaties tussen woordvormen en betekeniseenheden (concepten), en plaatst deze in de tijd. DiaMaNT (Diachroon seMantisch lexicon van … [Lees meer...] overDiachroon seMantisch lexicon van de Nederlandse Taal – DiaMaNT (Online)
NAMES Corpus
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus
NAMES Corpus Commercieel
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus Commercieel
CHN N-grams Commercieel
N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten tijdschriften, journaaluitzendingen en juridisch materiaal. CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende … [Lees meer...] overCHN N-grams Commercieel