Translation memory from Afrikaans to English (EN-GB), in the government domain for use in the Autshumato ITE application. Downloaddetails … [Lees meer...] overAutshumato Afrikaans-English Translation Memory
Corpus
VU-DNC-corpus (Online)
Een diachroon Nederlands krantencorpus dat bestaat uit data van vijf kranten. Voor elk van de kranten is data uit twee jaren beschikbaar (1950/1951 en 2002). A diachronic Dutch newspaper corpus, consisting of data from five newspapers, covering 2 separate years (1950/1951 and 2002). Ga naar website Productdetails Financier KNAW, … [Lees meer...] overVU-DNC-corpus (Online)
OpenSoNaR (Online)
Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar. Zie de productpagina SoNaR-Corpus. Vanwege auteursrechten is dit corpus enkel toegankelijk met een CLARIN-login. Online search engine for the SoNaR Corpus, a text collection of … [Lees meer...] overOpenSoNaR (Online)
Greedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
GrETEL is een gebruiksvriendelijke interface voor het doorzoeken van syntactisch geannoteerde corpora of treebanks. Dit is een uitgebreide versie van GrETEL, die wordt gehost door het Instituut voor de Nederlands Taal. De applicatie is uitgebreid met mogelijkheden voor federatief zoeken, waardoor meerdere corpora tegelijkertijd kunnen worden doorzocht. Deze applicatie is alleen … [Lees meer...] overGreedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
NAMES Corpus
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus