Deze dataset bevat 557 conversaties tussen mens en computer die manueel geannoteerd zijn en voorzien van samenvattingen.
Deze dataset is een uitbreiding op de originele BLISS Spoken Dialogue dataset die is uitgebracht in April 2020, met een klein aantal extra opgenomen mens-computer dialogen en Wizard-of-Oz mens-computerconversaties uit de originele JASMIN-CGN-dataset. Er zijn een totaal van 685 samenvattingen omdat we voor 98 samenvattingen die worden beschouwd als testmateriaal een tweede samenvatting hebben gemaakt.
Voor elke mens-computerdialoog presenteren we de originele handmatig getranscribeerde tekst van de gesproken dialoog, de geannoteerde dialoogtekst en een samenvatting van de dialoog.
This dataset consists of 557 Dutch human-computer conversations that were manually annotated with turnlabels and summarized into abstract summaries of the user’s answers.
This dataset is extended from the original BLISS Spoken Dialogue dataset which was realeased in April 2020, a handful of extra later recorded human-computer dialogues in the BLISS project, and Wizard-of-Oz human-machine conversations from the original JASMIN-CGN data set which was released in April 2005.
We use 68 dialogues from the BLISS project and 489 split dialogues from the JASMIN-CGN data set. We have a total of 685 summaries, as for 98 summaries deemed as test material we have created a second summary.
For each human-computer dialogue, we present the manually transcribed text of the spoken dialogues, annotated dialogue text, and summary of the dialogue.
Dataformaat | txt, wav |
Jaar | 2022 |
Opdrachtgever | NWO |
Project | Behaviour-based Language-Interactive Speaking Systems (BLISS): zie |
Refereren | BLISS Dialogue Summaries (Version 1.1) (2022) [Data set]. Available at the Dutch Language Institute: |
Talen | Nederlands |
Toepassing | Dialoogsystemen, spraakherkenning |
Versie | 1.1 |
Bestand | |
---|---| |
- Aantal bestanden 1
- Aantal downloads 44
- Bestandsgrootte 146.62 MB
- Datum plaatsing 02/06/2022
- Laatst bijgewerkt 09/12/2024
- Versie 1.1