Met Woordpeiler kunt u bekijken hoe vaak woorden door de tijd heen voorkomen in teksten uit Nederlandstalige kranten. Zoek op een woord en Woordpeiler visualiseert de frequentie ervan door de jaren heen in een grafiek, vanaf 2000 tot nu. Woordpeiler shows you how often words appear over time in texts from Dutch-language newspapers. Search for a word and Woordpeiler … [Lees meer...] overWoordpeiler (Online)
Productpagina
Gesproken Corpus van de zuidelijk-Nederlandse Dialecten – GCND (Online)
Het Gesproken Corpus van de zuidelijk-Nederlandse Dialecten (GCND) is een taalkundig geannoteerd corpus, gebaseerd op een unieke collectie van dialectopnames (Stemmen uit het Verleden) uit 768 verschillende plaatsen in België, het noorden van Frankrijk en het zuiden van Nederland bij in het algemeen weinig mobiele en laagopgeleide sprekers geboren rond 1900. De opnames werden … [Lees meer...] overGesproken Corpus van de zuidelijk-Nederlandse Dialecten – GCND (Online)
Spoken Academic Belgian Dutch Corpus – SABeD
Het Spoken Academic Belgian Dutch Corpus (SABeD) bestaat uit 200 colleges gegeven op Vlaamse hogescholen en universiteiten. De eerste 25 en de laatste 5 minuten van elk college werden getranscribeerd met behulp van een ASR-systeem dat is afgestemd op Belgisch-Nederlands. Vervolgens werd de spraak manueel opgedeeld in afzonderlijke uitingen (utterance segmentation) en werden de … [Lees meer...] overSpoken Academic Belgian Dutch Corpus – SABeD
Corpus Hedendaags Nederlands – CHN (Online)
Het Corpus Hedendaags Nederlands (CHN) is een tekstverzameling met ongeveer 9,6 miljoen teksten uit boeken, blogs, kranten, tijdschriften en journaaluitzendingen uit Nederland, Vlaanderen, Suriname en de Nederlandse Antillen. Samen zijn deze teksten goed voor ruim 3 miljard woorden. Vanwege auteursrechten is dat corpus alleen toegankelijk met een CLARIN-account. The Corpus … [Lees meer...] overCorpus Hedendaags Nederlands – CHN (Online)
Dataset containing hypothetical manner clauses in English and Dutch
Deze dataset bevat door komma's gescheiden bestanden (csv) met informatie over het gebruik van bijzinnen die worden ingeleid door het voegwoord 'as if' in de hedendaagse Britse spraak en van bijzinnen die worden ingeleid door het voegwoord 'alsof' in de hedendaagse Nederlandse spraak. Er is gebruikgemaakt van twee gesproken corpora: (i) het Gesproken BNC1994 en (ii) het Corpus … [Lees meer...] overDataset containing hypothetical manner clauses in English and Dutch