Het SoNaR Klein-corpus Commercieel is een tekstcorpus dat ongeveer 825.000 woorden tekst bevat die voorzien werden van verschillende soorten semantische annotaties, nl. named entity labelling, coreferentieannotatie, semantische rollen en de annotatie van spatiële en temporele relaties. Alle annotaties werden manueel geverifieerd. The SoNaR Klein corpus Commercial is a text … [Lees meer...] overSoNaR Klein-corpus Commercieel
Semantiek
Open Dutch Wordnet
Open Dutch Wordnet is een lexicale database voor het Nederlands, die 116.992 synsets bevat. Open Dutch Wordnet is a lexical dabase of Dutch containing 116,922 synsets. Ga naar website Details … [Lees meer...] overOpen Dutch Wordnet
D-TUNA-corpus
Het D-TUNA-corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële expressies. De semantische annotatie van alle expressies (xml-formaat) maakt het corpus bruikbaar als input voor taalgeneratiesystemen. De samenstelling van het D-TUNA-corpus is geïnspireerd op het Engelse TUNA Corpus. The D-TUNA corpus consists of 2400 written and (transcribed) … [Lees meer...] overD-TUNA-corpus
Etymologisch Woordenboek van het Nederlands (EWN)
Het Etymologisch Woordenboek van het Nederlands (EWN) is een wetenschappelijk etymologisch woordenboek voor het moderne bovenregionale Nederlands. Dat betekent dat er in principe geen verouderde en dialectische trefwoorden zijn opgenomen, hoe interessant die etymologisch gezien ook kunnen zijn. Voor de basisselectie van de trefwoorden in het EWN is uitgegaan van Van Dale Groot … [Lees meer...] overEtymologisch Woordenboek van het Nederlands (EWN)
Cornetto-LMF
Lexicale database voor het Nederlands met semantische relaties en combinatorische informatie. Alleen toegankelijk met een CLARIN-account. Lexical database of Dutch, providing semantic relationships and combinatorial information. Only accessible with a CLARIN account. Ga naar website Details … [Lees meer...] overCornetto-LMF