N-grammen zijn reeksen opeenvolgende woorden uit lopende teksten. De n-grammen in dit product zijn afkomstig uit het Corpus Hedendaags Nederlands (CHN), een groot corpus van voornamelijk hedendaagse kranten, tijdschriften, journaaluitzendingen en juridisch materiaal.
CHN N-grams bevat n-grammen met reeksen van één, twee en drie opeenvolgende woorden, met de bijbehorende absolute frequentie.
Productdetails
Dataformaat | txt |
Jaar | 2019 |
Opdrachtgever | INT |
Refereren | CHN N-grams (Version 1.0) (2019) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-p6 |
Talen | Nederlands |
Toepassing | Bijvoorbeeld schrijfhulp met woordvoorspelling. |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
chn-ngrams1.0.tgz |
- Aantal bestanden 1
- Aantal downloads 172
- Bestandsgrootte 4,265.86 MB
- Datum plaatsing 17/07/2020
- Laatst bijgewerkt 14/06/2024
- Versie 1.0