Het SoNaR Nieuwe Media Corpus 1.0 bevat nieuwemediateksten die verzameld werden binnen het STEVIN-project SoNaR. Het corpus bevat sms'en, tweets en chatberichten. De teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. Omdat dit product teksten bevat die afkomstig zijn uit correspondentie zoals tweets die via Twitter verzameld zijn, chats die via publieke … [Lees meer...] overSoNaR Nieuwe Media Corpus
Niet-commercieel
SoNaR-corpus
Het SoNaR-corpus is een tekstcorpus dat bestaat uit twee delen, nl. SoNaR-500 en SoNaR-1. SoNaR-500 bevat meer dan 500 miljoen woorden tekst afkomstig uit uiteenlopende domeinen en genres. Alle teksten werden getokeniseerd, ge-POS-tagd en gelemmatiseerd. Ook de named entities werden gelabeld. Alle annotaties van SoNaR-500 werden automatisch geproduceerd. SoNaR-1 is … [Lees meer...] overSoNaR-corpus
Referentiebestand Nederlands (RBN)
Het Referentiebestand Nederlands is een lexicon met ongeveer 50.000 trefwoorden en 90.000 vaste en vrije verbindingen. The Referentiebestand Nederlands is a collection of ca. 50,000 frequently used Dutch words, enriched with linguistic information. Productdetails Dataformaat Accessbestand, … [Lees meer...] overReferentiebestand Nederlands (RBN)
Referentiebestand Belgisch-Nederlands (RBBN)
Het Referentiebestand Belgisch-Nederlands bevat ca. 4000 woorden en uitdrukkingen die typisch zijn voor het Nederlands in BelgiĆ«. The Referentiebestand Belgisch-Nederlands contains approximately 4000 words and expressions that are typical for Dutch in Belgium. Productdetails Dataformaat Accessbestand Documentatie Gebruikershandleiding … [Lees meer...] overReferentiebestand Belgisch-Nederlands (RBBN)
PAROLE-lexicon
Het PAROLE-project heeft principes ontwikkeld voor het ontwerp, de structurering en de annotatie van corpora en lexica voor de Europese talen. Het Nederlandse lexicon bevat ruim 20.000 entry's, die voorzien werden van woordsoort, getal, naamval en syntactische complementatiepatronen. Het Nederlandse corpus is te verkrijgen bij ELRA, maar is ook opgenomen in het Corpus … [Lees meer...] overPAROLE-lexicon