Main Content
Catalogus taalmaterialen
Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied, zoals tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.
Om taalmaterialen te kunnen downloaden moet u eerst inloggen
Nieuw
U bent ingelogd.
Website van het Instituut voor de Nederlandse Taal met bronnen, data en tools voor taalkundig onderzoek binnen het Nederlandse taalgebied.
Zoek op naam / tags
Corpus Vlaamse Gebarentaal (Corpus VGT)
Het Corpus VGT is een verzameling van gannoteerde video’s in Vlaamse Gebarentaal. Informanten (sprekers VGT) spreken twee aan twee over een reeks thema’s.
The Corpus VGT is a collection of videos in Flemish Sign Language. Informants (native speakers of VGT) discuss in pairs a series of subjects.
Belgian Covid Sign Language Corpus (BeCoS Corpus)
Een geannoteerd parallel corpus gesproken taal (Nederlands, Frans, Duits) en gebarentaal (VGT, LSFB) gebaseerd op uitgezonden nieuwsberichten van de Belgische federale overheid betreffende COVID-19.
An annotated parallel corpus with speech (Flemish, French, German) and sign language (VGT, LSFB) based on news broadcasts from the Belgian federal government concerning COVID-19.
Annotated Corpora for Term Extraction Research (ACTER)
ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie).
ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind energy).
BLISS Dialogue Summaries
Nederlandse spraakopnames van deelnemers die spreken met het BLISS-dialoogsysteem (v1) over alledaagse bezigheden en activiteiten waar ze plezier aan beleven. De data bevat 55 opnames met een gemiddelde duur van 2 minuten en 34 seconden.
Dutch recordings of participants who talk with the BLISS dialogue system about their everyday occupations and their favorite activities. The corpus contains 55 recordings with an average duration of 2 minutes and 34 seconds.
Couranten Corpus (Online)
Het Couranten Corpus bevat dertien zeventiende-eeuwse Nederlandse kranten uit de periode 1619-1700 die momenteel op Delpher.nl beschikbaar zijn.
The Couranten Corpus contains thirteen seventeenth-century Dutch newspapers from the period 1619-1700, which are currently available on Delpher.nl.