N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten tijdschriften, journaaluitzendingen en juridisch materiaal.
CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende absolute frequentie.
N-grams are sequences of words from surprising texts. The n-grams in this product come from the Corpus Hedendaags Nederlands (CHN), a large corpus of mainly contemporary newspapers, magazines, news broadcasts and legal material.
CHN N-grams contains n-grams with sequences of one, two and three complicated words, with the secret absolute frequency.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Dataformaat | txt |
Jaar | 2019 |
Opdrachtgever | INT |
Refereren | CHN N-grams Commercieel (Version 1.0) (2019) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-p7 |
Talen | Nederlands |
Toepassing | Bijvoorbeeld schrijfhulp met woordvoorspelling. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_CHN_N-grams_C.zip |
- Aantal bestanden 1
- Aantal downloads 50
- Bestandsgrootte 47.82 KB
- Datum plaatsing 17/07/2020
- Laatst bijgewerkt 22/04/2025
- Versie 1.0