Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
The SumNL-samenvattingencorpus is based on 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles relevant to the topic. For each cluster, two summaries of different sizes were created as well as extracts consisting of 10 sentences from the texts.
Productdetails
Documentatie | Technisch rapport |
Eigenaar | Universiteit Antwerpen |
Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
Jaar | 2014 |
Refereren | SumNL-samenvattingencorpus (Version 1.0.1) (2014) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-h7 |
Talen | Nederlands |
Versie | 1.0.1 |
Downloaddetails
Bestand | |
---|---|
SumNL-samenvattingencorpus_Niet-commercieel_1.0.1.zip |
- Aantal bestanden 1
- Aantal downloads 35
- Bestandsgrootte 1.60 MB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 28/04/2025
- Versie 1.0.1