MuST-Cinema-PE is een corpus met post-editingdata van automatisch gegenereerde ondertitels. Het bevat automatisch gegenereerde ondertitels voor 9 video's van TED-talks, hun post-editingversies en procesdata (proceslogs, toetsaanslagen) van drie professionele ondertitelaars in twee taalparen (Engels naar Duits/Italiaans).
Dit taalmateriaal is tijdelijk niet bereikbaar.
MuST-Cinema-PE is a corpus containing post-editing data of automatically-generated subtitles. It contains automatically-generated subtitles for 9 TED talk videos, their post-edited versions as well as process data (process logs, keystrokes) from three professional subtitlers in two language pairs (English into German/Italian).
This language resource is temporarily not available.
Productdetails
Dataformaat | .wav; .txt; .csv; .srt |
Jaar | 2024 |
Financier | Fondazione Bruno Kessler |
Eigenaar | Fondazione Bruno Kessler |
Publicatie | Karakanta, A., Cettelo, M., Negri, M. & Bentivogli, L. Evaluating Automatic Subtitling: Correlating Post-editing Effort and Automatic Metrics |
Refereren | MuST-Cinema-PE: post-editing in automatic subtitling (version 1.0) (2024) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-y2 |
Talen | English, Italian, German |
Omvang | 1 uur video, 545 zinnen voor Italiaans, 542 zinnen voor Duits |
Versie | 1.0 |
Licentie | Creative Commons Attribution-NonCommercial-NoDerivs 4.0 International. |
Downloaddetails
Bestand | |
---|---|
MuST-Cinema-PE1.0.zip |
- Aantal bestanden 1
- Aantal downloads 4
- Bestandsgrootte 146.62 MB
- Datum plaatsing 22/03/2024
- Laatst bijgewerkt 05/09/2024
- Versie 1.0