Dit corpus is tijdelijk niet beschikbaar omdat er aanpassingen noodzakelijk zijn. Een nieuwe versie wordt verwacht in de zomer van 2024. Voor meer informatie hierover kunt u contact opnemen met Hans van de Velde (HvandeVelde@fryske-akademy.nl) of met Wilbert Heeringa, de datamanager van de FA (wheeringa@fryske-akademy.nl). Het Boarnsterhim Corpus bestaat uit 250 uur spraak in … [Lees meer...] overBoarnsterhim Corpus (BHC)
Productpagina
Wablieft-corpus
Het Wablieft-corpus bevat het digitaal archief van de Wablieft-krant (periode 2011-2017), zoals ook beschikbaar op de website http://www.wablieft.be/krant/archief. Het bevat 2 miljoen woorden krantenmateriaal in eenvoudig te lezen Nederlands. Er is metadata beschikbaar i.v.m. de krantenrubriek (binnenland, sport, ...) en de publicatiedatum. Het betreft al het materiaal sinds … [Lees meer...] overWablieft-corpus
Xitsonga Genre Classification Corpus
Contains training and testing data for genre classification for Xitsonga. Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Cross-Lingual Genre Classification for Closely Related Languages (Prasa 2012) Eigenaar Trifonius Financier Department of Arts and Culture Licentiesoort Creative Commons Attribution 2.5 South … [Lees meer...] overXitsonga Genre Classification Corpus
Xitsonga Custom Dictionary for Government Domain
Custom dictionary developed in a spelling checker project for the Department of Arts and Culture. Contains words exclusive to the government domain or words that are not part of the official orthography of the language. Productdetails Annotaties Alphabetic list, one word(token) per line, Text, ANSI (Unicode) Dataformaat txt Documentatie Project report on … [Lees meer...] overXitsonga Custom Dictionary for Government Domain
Tshivenda Genre Classification Corpus
Contains training and testing data for genre classification for Tshivenda. Productdetails Annotaties UTF8, Running text Dataformaat txt Documentatie Cross-Lingual Genre Classification for Closely Related Languages (Prasa 2012) Eigenaar Trifonius Financier Department of Arts and Culture Licentiesoort Creative Commons Attribution 2.5 South … [Lees meer...] overTshivenda Genre Classification Corpus