Translation memory from Afrikaans to English (EN-GB), in the government domain for use in the Autshumato ITE application. Downloaddetails … [Lees meer...] overAutshumato Afrikaans-English Translation Memory
Corpus
VU-DNC-corpus (Online)
Een diachroon Nederlands krantencorpus dat bestaat uit data van vijf kranten. Voor elk van de kranten is data uit twee jaren beschikbaar (1950/1951 en 2002). A diachronic Dutch newspaper corpus, consisting of data from five newspapers, covering 2 separate years (1950/1951 and 2002). Ga naar website Productdetails Financier KNAW, … [Lees meer...] overVU-DNC-corpus (Online)
OpenSoNaR (Online)
Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar. Zie de productpagina SoNaR-Corpus. Vanwege auteursrechten is dit corpus enkel toegankelijk met een CLARIN-login. Online search engine for the SoNaR Corpus, a text collection of … [Lees meer...] overOpenSoNaR (Online)
Greedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
GrETEL is een gebruiksvriendelijke interface voor het doorzoeken van syntactisch geannoteerde corpora ofwel treebanks. Deze applicatie is alleen toegankelijk met een CLARIN-account. GrETEL is a user-friendly search engine for the exploitation of syntactically annotated corpora or treebanks. This application is only accessible with a CLARIN account. Ga naar … [Lees meer...] overGreedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
NAMES Corpus
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus