Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
The SumNL-samenvattingencorpus is based on 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles relevant to the topic. For each cluster, two summaries of different sizes were created as well as extracts consisting of 10 sentences from the texts.
Productdetails
| Documentatie | Technisch rapport |
| Eigenaar | Universiteit Antwerpen |
| Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
| Jaar | 2014 |
| Refereren | SumNL-samenvattingencorpus (Version 1.0.1) (2014) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-h7 |
| Talen | Nederlands |
| Versie | 1.0.1 |
Downloaddetails
| Bestand | |
|---|---|
| SumNL-samenvattingencorpus_Niet-commercieel_1.0.1.zip |
- Aantal bestanden 1
- Aantal downloads 39
- Bestandsgrootte 1.60 MB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 13/02/2026
- Versie 1.0.1