Main Content
Catalogus taalmaterialen
Deze catalogus bevat bronnen, data en tools voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het Nederlandse taalgebied, zoals tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.
Om taalmaterialen te kunnen downloaden moet u eerst inloggen
Nieuw
Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing
"Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing" bestaat uit zinnen uit het SoNaR-corpus, een door GPT-4 vereenvoudigde versie daarvan en de menselijke beoordelingen van die vereenvoudigingen.
Lees meerDataset Synthetische Simplificatie
De Dataset Synthetische Simplificatie bestaat uit 6.986 zinnen uit het SoNaR-corpus en een door GPT-4 gemaakte vereenvoudiging daarvan.
Lees meerLassy Groot-corpus Commercieel
Een corpus bestaande uit circa 476 miljoen woorden dat automatisch voorzien werd van syntactische annotaties. The corpus contains about about 476 million words with automatically generated syntactic annotations.
Lees meer4-Language Finance, Economy & Business Terminology — NL-EN-FR-DE (version 2.0) (Online)
De termenbank 4-Language Finance, Economy & Business Terminology — NL-EN-FR-DE (version 2.0) bevat begrippen, afkortingen en namen van instanties uit de financieel-economische wereld. The 4-Language Finance, Economy & Business Terminology database - NL-EN-FR-DE (version 2.0) contains terms, abbreviations and names of organisations from the world of finance.
Lees meerWoordenboek van Nieuwe Woorden - WNW (Online)
Het Woordenboek van Nieuwe Woorden (WNW) is een online woordenboek waarin woorden die vanaf het jaar 2000 zijn ontstaan, worden beschreven. The Dictionary of New Words (WNW) is an online dictionary describing words created from the year 2000 onwards.
Lees meer