Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
De commerciƫle versie van dit corpus bevat een tweetal clusters minder dan de niet-commerciƫle versie.
Productdetails
Documentatie | Technisch rapport |
Eigenaar | Universiteit Antwerpen |
Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
Jaar | 2014 |
Refereren | SumNL-samenvattingencorpus Commercieel (Version 1.0) (2014) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-q5 |
Talen | Nederlands |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_SumNL_C.zip |
- Aantal bestanden 1
- Aantal downloads 2
- Bestandsgrootte 52.37 KB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 24/09/2020
- Versie 1.0