Het COREA-coreferentiecorpus (circa 150.000 woorden) bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn. De teksten bestaan uit krantenartikelen (D-Coi), getranscribeerde spraak (CGN) en lemma's uit de Spectrum (Winkler Prins) Medische Encyclopedie.
A corpus of Dutch texts with annotated coreference relations.
Productdetails
Dataformaat | xml, MMAX2 |
Demo | Voorbeelden van gemarkeerde corpusteksten |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2014 |
Opdrachtgever | NTU|STEVIN |
Project | COREA |
Refereren | COREA-coreferentiecorpus (Version 1.0.1) (2014) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-f9 |
Talen | Nederlands |
Toepassing | Automatische tekstanalyse, automatisch samenvatten. |
Versie | 1.0.1 |
Downloaddetails
Bestand | |
---|---|
COREA_Corpus_1.0.1p1.zip |
- Aantal bestanden 1
- Aantal downloads 22
- Bestandsgrootte 5.42 MB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 14/06/2024
- Versie 1.0.1