Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
De commerciële versie van dit corpus bevat een tweetal clusters minder dan de niet-commerciële versie.
The SumNL Corpus of Abstracts is based on 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles that are relevant for that topic.
The commercial version of this corpus contains two fewer clusters than the non commercial version.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Documentatie | Technisch rapport |
Eigenaar | Universiteit Antwerpen |
Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
Jaar | 2014 |
Refereren | SumNL-samenvattingencorpus Commercieel (Version 1.0) (2014) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-q5 |
Talen | Nederlands |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_SumNL_C.zip |
- Aantal bestanden 1
- Aantal downloads 12
- Bestandsgrootte 52.37 KB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 15/10/2024
- Versie 1.0