Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing

Het taalmateriaal "Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing" is samengesteld in het kader van het project Duidelijke Taal. De dataset bestaat uit zinnen uit het SoNaR-corpus, een door GPT-4 vereenvoudigde versie daarvan en de menselijke beoordelingen van die vereenvoudigingen met betrekking tot eenvoud, accuraatheid en vlotheid.

The language material ‘Human evaluation of automated text simplification: crowdsourcing results’ was compiled as part of the Duidelijke Taal project. The dataset consists of sentences from the SoNaR corpus, a version simplified by GPT-4 and the human evaluations of those simplifications with respect to simplicity, accuracy and fluency.

Productdetails

Dataformaat	.csv
Jaar	2024
Eigenaar	Instituut voor de Nederlandse Taal
Crowdsourcingapplicatie	https://duidelijketaal.ivdnt.org/
Publicatie	Vincent Vandeghinste, Job van Doeselaar en Bram Vanroy (2024). Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging door middel van crowdsourcing
Refereren	Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing (Version 1.0) (2024) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-y8
Talen	Nederlands
Omvang	6.986 originele zinnen en 6.986 vereenvoudigde zinnen
Versie	1.0
Licentie	Creative Commons Attribution Non-commercial 4.0 International.

Downloaddetails

Bestand
DuidelijkeTaal_EvaluatieGeautomatiseerdeTekstvereenvoudiging_1.0.zip

Aantal bestanden 1
Aantal downloads 65
Bestandsgrootte 146.62 MB
Datum plaatsing 07/11/2024
Laatst bijgewerkt 10/06/2025
Versie 1.0