Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
The SumNL Corpus of Abstracts is based on 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles that are relevant for that topic.
Productdetails
Documentatie | Technisch rapport |
Eigenaar | Universiteit Antwerpen |
Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
Jaar | 2014 |
Refereren | SumNL-samenvattingencorpus (Version 1.0.1) (2014) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-h7 |
Talen | Nederlands |
Versie | 1.0.1 |
Downloaddetails
Bestand | |
---|---|
SumNL-samenvattingencorpus_Niet-commercieel_1.0.1.zip |
- Aantal bestanden 1
- Aantal downloads 34
- Bestandsgrootte 1.60 MB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 26/11/2024
- Versie 1.0.1