OMBI-Arabisch-Nederlands is een bilinguaal lexicaal bestand in xml-LMF-formaat. Het bestand bevat ca. 37.000 entry's en is geschikt voor taaltechnologische toepassingen zoals automatisch vertalen, e-learning, multilingual information retrieval etc. Bilingual lexicon with Arabic as source language and Dutch as target language. Dit product is gratis. Maar het is wel … [Lees meer...] overOMBI Arabisch-Nederlands Commercieel
Commercieel
Medische Termen Belgisch-Nederlands (MedTermBN) Commercieel
Medische Termen Belgisch-Nederlands bestaat uit een lijst met een groot aantal Nederlandstalige medische termen die in België of in Nederland worden gebruikt. Van deze termen mag niet worden aangenomen dat zij in beide landen worden gebruikt en begrepen. De opgenomen termen zijn afkomstig uit verschillende gebruiksregisters en betreffen in hoofdzaak woorden en uitdrukkingen uit … [Lees meer...] overMedische Termen Belgisch-Nederlands (MedTermBN) Commercieel
Lassy Klein-corpus Commercieel
Het Lassy Klein-corpus Commercieel is een corpus van ongeveer 825.000 woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en … [Lees meer...] overLassy Klein-corpus Commercieel
Lassy Groot-corpus Commercieel
Het Lassy Groot-corpus Commercieel is een corpus van ongeveer 476 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. Vanwege de hoeveelheid data wordt dit product gedistribueerd op een externe … [Lees meer...] overLassy Groot-corpus Commercieel
JASMIN-spraakcorpus Commercieel
Het JASMIN-spraakcorpus is een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, woonachtig in Vlaanderen en Nederland. De spraakopnames bestaan uit voorgelezen teksten en mens-machinedialogen, en zijn verrijkt met verschillende annotatielagen. Het JASMIN-spraakcorpus is een aanvulling op het Corpus Gesproken Nederlands (CGN). A … [Lees meer...] overJASMIN-spraakcorpus Commercieel