Het SumNL-samenvattingencorpus is gebaseerd op 28 clusters. Ieder cluster bestaat uit een onderwerp en 5-25 krantenartikelen die relevant zijn voor het onderwerp.
The SumNL Corpus of Abstracts is based on 30 clusters. Each cluster consists of a topic and 5-25 newspaper articles that are relevant for that topic.