De Dutch Idiom Database: Native Speakers is een database met beoordelingen van 390 moedertaalsprekers van 374 Nederlandse uitdrukkingen. In een online onderzoek hebben de deelnemers de idiomatische uitdrukkingen beoordeeld op een aantal aspecten: frequentie, gebruik, bekendheid, voorstelbaarheid, herkenbaarheid en transparantie. Ook is onderzocht of ze de juiste betekenis van … [Lees meer...] overDutch Idiom Database: Native Speakers (DID-NS)
Productpagina
Boarnsterhim Corpus (BHC)
Dit corpus is tijdelijk niet beschikbaar omdat er aanpassingen noodzakelijk zijn. Er wordt gewerkt aan een nieuwe versie. Voor meer informatie hierover kunt u contact opnemen met Hans van de Velde (HvandeVelde@fryske-akademy.nl) of met Wilbert Heeringa, de datamanager van de FA (wheeringa@fryske-akademy.nl). Het Boarnsterhim Corpus bestaat uit 250 uur spraak in zowel … [Lees meer...] overBoarnsterhim Corpus (BHC)
Wablieft-corpus
Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief. Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata beschikbaar i.v.m. de krantenrubriek (binnenland, sport, ...) en de publicatiedatum. Het betreft al het materiaal sinds de … [Lees meer...] overWablieft-corpus
Xitsonga Genre Classification Corpus
Contains training and testing data for genre classification for Xitsonga. Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Cross-Lingual Genre Classification for Closely Related Languages (Prasa 2012) Eigenaar Trifonius Financier Department of Arts and Culture Licentiesoort Creative Commons Attribution 2.5 South … [Lees meer...] overXitsonga Genre Classification Corpus
Xitsonga Custom Dictionary for Government Domain
Custom dictionary developed in a spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language. Productdetails Annotaties Alphabetic list, one word(token) per line, Text, ANSI (Unicode) Dataformaat txt Documentatie Project report on … [Lees meer...] overXitsonga Custom Dictionary for Government Domain