Het SumNL-samenvattingencorpus is gebaseerd op 30 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp. Voor ieder cluster werden twee samenvattingen gemaakt van verschillende grootte en ook extracts bestaande uit tien zinnen uit de teksten.
De commerciƫle versie van dit corpus bevat een tweetal clusters minder dan de niet-commerciƫle versie.
The SumNL Corpus of Abstracts is based om 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles that are relevant for that topic.
Dit product is gratis. Maar het is wel noodzakelijk dat eerst een licentie wordt ondertekend. De download bevat de licentie en verdere instructies voor het plaatsen van een bestelling.
Productdetails
Documentatie | Technisch rapport |
Eigenaar | Universiteit Antwerpen |
Financier | Universiteit Antwerpen (Kleine Projecten BOF 2008) |
Jaar | 2014 |
Refereren | SumNL-samenvattingencorpus Commercieel (Version 1.0) (2014) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-q5 |
Talen | Nederlands |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
BP_SumNL_C.zip |
- Aantal bestanden 1
- Aantal downloads 2
- Bestandsgrootte 52.37 KB
- Datum plaatsing 04/09/2020
- Laatst bijgewerkt 22/07/2021
- Versie 1.0