Main Content
Catalogus taalmaterialen
Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied, zoals tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.
Om taalmaterialen te kunnen downloaden moet u eerst inloggen
Nieuw
U bent ingelogd.
Website van het Instituut voor de Nederlandse Taal met bronnen, data en tools voor taalkundig onderzoek binnen het Nederlandse taalgebied.
Zoek op naam / tags
Corpus Ondertitelde UVN-Colleges (COUC)
Subtitled videos of lectures in Dutch. The subtitles are an exact transcriptions of the recorded speech.
Lees meerDatabase van de Zuidelijk-Nederlandse Dialecten (DSDD)
De database van de Zuidelijk-Nederlandse dialecten is samengesteld uit drie regionale dialectwoordenboeken: het Woordenboek van de Vlaamse Dialecten (WVD), het Woordenboek van de Brabantse Dialecten (WBD) en het Woordenboek van de Limburgse Dialecten.

The Database of the Southern Dutch Dialects (DSDD) is an aggregation of three regional dialect dictionaries: the Dictionary of Flemish Dialects (Woordenboek van de Vlaamse Dialecten - WVD), the Dictionary of the Brabantian Dialects (Woordenboek van de Brabantse Dialecten - WBD), and the Dictionary of the Limburgian Dialects (Woordenboek van de Limburgse Dialecten - WLD).
Lees meerDutch Idiom Database: Native Speakers (DID-NS)
Een database met beoordelingen van Nederlandse uitdrukkingen door moedertaalsprekers.
Lees meerBoarnsterhim Corpus (BHC)
Het Boarnsterhim Corpus bestaat uit 250 uur spraak in zowel West-Fries als Nederlands door dezelfde groep tweetalige sprekers. Het corpus bevat originele opnamen uit 1982-1984 en een replicerend onderzoek 35 jaar later. De dataverzameling omvat de spraak van vier generaties en combineert paneldata en trenddata.
The Boarnsterhim Corpus consists of 250 hours of speech in both West Frisian and Dutch by the same sample of bilingual speakers. The corpus contains original recordings from 1982-1984 and a replication study recorded 35 years later. The data collection spans speech of four generations, and combines panel and trend data.
Wablieft-corpus
Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017).
Lees meer