Het taalmateriaal "Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing" is samengesteld in het kader van het project Duidelijke Taal. De dataset bestaat uit zinnen uit het SoNaR-corpus, een door GPT-4 vereenvoudigde versie daarvan en de menselijke beoordelingen van die vereenvoudigingen met betrekking tot eenvoud, accuraatheid en vlotheid.
Productdetails
Dataformaat | .csv |
Jaar | 2024 |
Eigenaar | Instituut voor de Nederlandse Taal; Taalunie |
Crowdsourcingapplicatie | https://duidelijketaal.ivdnt.org/ |
Publicatie | Vincent Vandeghinste, Job van Doeslaar en Bram Vanroy (2024). Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging door middel van crowdsourcing |
Refereren | Menselijke evaluatie van geautomatiseerde tekstvereenvoudiging: resultaten van crowdsourcing (Version 1.0) (2024) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-y8 |
Talen | Nederlands |
Omvang | 6.986 originele zinnen en 6.986 vereenvoudigde zinnen |
Versie | 1.0 |
Licentie | 6.986. |
Downloaddetails
Bestand | |
---|---|
SABeD-corpus_1.0.zip |
- Aantal bestanden 1
- Aantal downloads 34
- Bestandsgrootte 146.62 MB
- Datum plaatsing 07/11/2024
- Laatst bijgewerkt 12/11/2024
- Versie 1.0