ACTER is een handmatig geannoteerde dataset voor termextractie, die drie talen omvat (Engels, Frans en Nederlands), en vier domeinen (corruptie, dressuur, hartfalen en windenergie).
ACTER is a manually annotated dataset for term extraction, covering 3 languages (English, French, and Dutch), and 4 domains (corruption, dressage, heart failure, and wind energy).
Productdetails
| Dataformaat | txt |
| Jaar | 2022 |
| Opdrachtgever | Universiteit Gent |
| Project | Ayla Rigouts Terryn’s PhD project + first TermEval shared task (CompuTerm2020) |
| Financier | FWO (FWO17/ASP/068) |
| Documentatie | Readme |
| Refereren | Rigouts Terryn, Ayla, 2020, ACTER (Annotated Corpora for Term Extraction Research) v1.5, Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-v4. |
| Talen | Nederlands, Frans, Engels |
| Omvang | 18.979 termen, 758.053 woorden |
| Toepassing | Termextractie |
| Versie | 1.5 |
| Licentie | Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International. |
Downloaddetails
| Bestand | |
|---|---|
| ACTER_1.5.zip |
- Aantal bestanden 1
- Aantal downloads 25
- Bestandsgrootte 146.62 MB
- Datum plaatsing 03/08/2022
- Laatst bijgewerkt 10/06/2025
- Versie 1.5
