Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd.
Het corpus is beschikbaar in zowel xml- als in Dact-formaat en de zoeksoftware Dact wordt meegeleverd in het downloadbestand. De download bevat daarnaast ook frequentielijsten.
Dit is niet de meest recente versie van dit product. De meest recente is Versie 7.0. Als u vragen heeft over deze versie neem dan contact op met taalmaterialen@ivdnt.org
Productdetails
Dataformaat | xml, dact |
Documentatie | LREC2006-artikel; TLT2009-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2016 |
Opdrachtgever | NTU|STEVIN |
Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
Refereren | Lassy Klein-corpus (Version 4.0) (2016) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-g7 |
Software | Dact |
Talen | Nederlands |
Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
Versie | 4.0 |
Downloaddetails
- Aantal bestanden 0
- Aantal downloads 65
- Bestandsgrootte 947.97 MB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 09/07/2024
- Versie 4.0