ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie).
ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind energy).
Productdetails
Dataformaat | txt |
Jaar | 2022 |
Opdrachtgever | Universiteit Gent |
Project | Ayla Rigouts Terryn’s PhD project + first TermEval shared task (CompuTerm2020) |
Financier | FWO (FWO17/ASP/068) |
Documentatie | Readme |
Refereren | Rigouts Terryn, Ayla, 2020, ACTER (Annotated Corpora for Term Extraction Research) v1.5, Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-v4. |
Talen | Nederlands, Frans, Engels |
Omvang | 18.979 termen, 758.053 woorden |
Toepassing | Termextractie |
Versie | 1.5 |
Licentie | Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International. |
Downloaddetails
Bestand | |
---|---|
acter1.5.zip |
- Aantal bestanden 1
- Aantal downloads 21
- Bestandsgrootte 146.62 MB
- Datum plaatsing 03/08/2022
- Laatst bijgewerkt 14/06/2024
- Versie 1.5