Het COREA-coreferentiecorpus (circa 150.000 woorden) bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn. De teksten bestaan uit krantenartikelen (D-Coi), getranscribeerde spraak (CGN) en lemma's uit de Spectrum (Winkler Prins) Medische Encyclopedie.
Productdetails
Dataformaat | xml, MMAX2 |
Demo | Voorbeelden van gemarkeerde corpusteksten |
Documentatie | LREC2008-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2014 |
Opdrachtgever | NTU|STEVIN |
Project | COREA |
Refereren | COREA-coreferentiecorpus Commercieel (Version 1.0.1) (2014) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-e9 |
Talen | Nederlands |
Toepassing | Automatische tekstanalyse, automatisch samenvatten. |
Website | http://corea.tst-centrale.org/ |
Versie | 1.0.1 |
Downloaddetails
Bestand | |
---|---|
BP_COREA_CoreferentiecorpusC.zip |
- Aantal bestanden 1
- Aantal downloads 2
- Bestandsgrootte 51.68 KB
- Datum plaatsing 02/09/2020
- Laatst bijgewerkt 06/01/2021
- Versie 1.0.1