Online zoeksysteem voor het SoNaR-corpus, een tekstverzameling van hedendaags geschreven Nederlands dat uit meer dan 500 miljoen woorden bestaat. Het SoNaR-corpus is ook als download beschikbaar. Zie de productpagina SoNaR-Corpus. Vanwege auteursrechten is dit corpus enkel toegankelijk met een CLARIN-login. Online search engine for the SoNaR Corpus, a text collection of … [Lees meer...] overOpenSoNaR (Online)
Corpus
Greedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
GrETEL is een gebruiksvriendelijke interface voor het doorzoeken van syntactisch geannoteerde corpora ofwel treebanks. Deze applicatie is alleen toegankelijk met een CLARIN-account. GrETEL is a user-friendly search engine for the exploitation of syntactically annotated corpora or treebanks. This application is only accessible with a CLARIN account. Ga naar … [Lees meer...] overGreedy Extraction of Trees for Empirical Linguistics – GrETEL 4 (Online)
NAMES Corpus
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus
NAMES Corpus Commercieel
Het NAMES Corpus bevat een verzameling van 189.707 voornamen (61,9 miljoen tokens) en 562.676 achternamen (54,6 miljoen tokens) zoals gevonden in 19de-eeuwse geboorte-, huwelijks- en overlijdensakten (toegankelijk via wiewaswie.nl in de versie van 2011). Het is een resultaat van het CLARIAH-project 'NAMES' dat als doel had naamstandaarden te ontwikkelen voor het beheersen van … [Lees meer...] overNAMES Corpus Commercieel
CGN-annotaties Commercieel
De CGN-annotaties bevatten het volledig geannoteerde Corpus Gesproken Nederlands (CGN) in getranscribeerde vorm en ook Corex, de corpusexploratiesoftware die bij het CGN hoort. Hou er rekening mee dat de software verouderd is en dat die niet meer geüpdatet of ondersteund wordt. The CGN Annotations contain the data from the Spoken Dutch Corpus (CGN) minus the sound data. … [Lees meer...] overCGN-annotaties Commercieel