ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie).
ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind energy).
Productdetails
Dataformaat | txt |
Jaar | 2020 |
Opdrachtgever | Universiteit Gent |
Project | Ayla Rigouts Terryn’s PhD project + first TermEval shared task (CompuTerm2020) |
Financier | FWO (FWO17/ASP/068) |
Refereren | Rigouts Terryn, Ayla, 2020, ACTER (Annotated Corpora for Term Extraction Research) v1.4, Eurac Research CLARIN Centre, http://hdl.handle.net/20.500.12124/38. |
Talen | Nederlands, Frans, Engels |
Omvang | 19002 termen, 596058 woorden |
Toepassing | Termextractie |
Versie | 1.4 |
Downloaddetails
Bestand | |
---|---|
acter1.4.zip |
- Aantal bestanden 1
- Aantal downloads 0
- Bestandsgrootte 146.62 MB
- Datum plaatsing 01/08/2012
- Laatst bijgewerkt 03/08/2022
- Versie 1.4