Het Lassy Klein-corpus is een corpus van ongeveer 1 miljoen woorden met manueel geverifieerde syntactische annotaties. Lemma’s en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino. De lemma’s, POS-tags en syntactische boomstructuren werden geverifieerd en gecorrigeerd.
Het corpus is beschikbaar in zowel xml- als in Dact-formaat en de zoeksoftware Dact wordt meegeleverd in het downloadbestand. De download bevat daarnaast ook frequentielijsten.
Deze versie is vervallen. De meest recente versie is hier te vinden: http://hdl.handle.net/10032/tm-a2-w9.
The Lassy Small Corpus contains about a million words with manually verified syntactical annotations.
This version is deprecated. The most recent version can be found here: http://hdl.handle.net/10032/tm-a2-w9.
Productdetails
| Dataformaat | xml, dact |
| Documentatie | LREC2006-artikel; TLT2009-artikel, Aanpassingen Versie 6.0 |
| Eigenaar | Taalunie |
| Financier | NTU|STEVIN |
| Jaar | 2021 |
| Opdrachtgever | NTU|STEVIN |
| Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
| Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
| Refereren | Lassy Klein-corpus (Version 6.0) (2021) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-s9 |
| Software | Dact |
| Talen | Nederlands |
| Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
| Versie | 6.0 |
Downloaddetails
- Aantal bestanden 0
- Aantal downloads 70
- Bestandsgrootte 947.97 MB
- Datum plaatsing 12/05/2021
- Laatst bijgewerkt 14/06/2024
- Versie 6.0