Het SoNaR Klein-corpus Commercieel is een tekstcorpus dat ongeveer 825.000 woorden tekst bevat die voorzien werden van verschillende soorten semantische annotaties, nl. named entity labelling, coreferentieannotatie, semantische rollen en de annotatie van spatiĆ«le en temporele relaties. Alle annotaties werden manueel geverifieerd. The SoNaR Klein corpus Commercial is a text … [Lees meer...] overSoNaR Klein-corpus Commercieel
Commercieel
SoNaR Groot-corpus Commercieel
Het SoNaR Groot-corpus Commercieel is een tekstcorpus dat ongeveer 271 miljoen woorden tekst bevat, afkomstig uit uiteenlopende domeinen en genres. Alle teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. Ook de named entities werden gelabeld. Alle annotaties werden automatisch geproduceerd. Dit taalmateriaal wordt standaard als download aangeboden en dan worden er … [Lees meer...] overSoNaR Groot-corpus Commercieel
Referentiebestand Nederlands (RBN) Commercieel
Het Referentiebestand Nederlands is een lexicon met ongeveer 50.000 trefwoorden en 90.000 vaste en vrije verbindingen. The Referentiebestand Nederlands is a collection of ca. 50,000 frequently used Dutch words, enriched with linguistic information. Dit product is gratis. Maar het is wel noodzakelijk dat eerst een licentie wordt ondertekend. De download bevat de … [Lees meer...] overReferentiebestand Nederlands (RBN) Commercieel
Referentiebestand Belgisch-Nederlands (RBBN) Commercieel
Het Referentiebestand Belgisch-Nederlands bevat ca. 4000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in BelgiĆ«. The Referentiebestand Belgisch-Nederlands is a collection of 4000 words and expressions that are typical for Belgian Dutch. Dit product is gratis. Maar het is wel noodzakelijk dat eerst een licentie wordt ondertekend. De download bevat de … [Lees meer...] overReferentiebestand Belgisch-Nederlands (RBBN) Commercieel
OMBI Nederlands-Indonesisch Commercieel
OMBI Nederlands-Indonesisch is een bilinguaal lexicaal bestand in xml-LMF-formaat met Nederlands als de brontaal en Indonesisch als de doeltaal. Het bestand is geschikt voor taaltechnologische toepassingen zoals automatisch vertalen, e-learning, multilingual information retrieval, enz. OMBI Dutch-Indonesian is a bilingual lexical file in xml-LMF format with Dutch as the … [Lees meer...] overOMBI Nederlands-Indonesisch Commercieel