Het Lassy Groot-corpus Commercieel is een corpus van ongeveer 476 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.
Standaard wordt dit taalmateriaal als download aangeboden en dan zijn er geen kosten aan verbonden. Maar vanwege de grote hoeveelheid gegevens kan het Lassy Groot-corpus ook op een externe harde schijf worden aangevraagd. Hiervoor brengt de INT €100,00 verzend- en administratiekosten in rekening.
Deze versie is vervangen door een nieuwere: versie 7.0
The Lassy Large Corpus Commercial contains about 476 million words with automatically generated syntactic annotations. The lemmas and POS tags were automatically added to the corpus using Tadpole (now: Frog). The syntactic dependency structures were added using Alpino.
By default, this language material is offered as a download and then there is no charge. But because of the large amount of data, the Lassy Large Corpus can also be requested on an external hard disk. For this the INT charges a €100.00 shipping and handling fee.
This version has been replaced by a new one: version 7.0
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Dataformaat | xml (compact) |
Documentatie | LREC2006-artikel; TLT2009-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2015 |
Opdrachtgever | NTU|STEVIN |
Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
Refereren | Lassy Groot-corpus Commercieel (Version 2.0) (2015) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-m7 |
Talen | Nederlands |
Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
Versie | 2.0 |
Downloaddetails
- Aantal bestanden 0
- Aantal downloads 18
- Bestandsgrootte 52.37 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 17/10/2024
- Versie 2.0