Het Lassy Groot-corpus Commercieel is een corpus van ongeveer 476 miljoen woorden met automatisch gegenereerde syntactische annotaties. De lemma's en POS-tags werden automatisch toegevoegd aan het corpus m.b.v. Tadpole (nu: Frog). De syntactische dependentiestructuren werden toegevoegd m.b.v. Alpino.
Vanwege de hoeveelheid data wordt dit product gedistribueerd op een externe harde schijf. Hier rekent het INT €100,00 verzend- en afhandelingskosten voor.
The Lassy Large Corpus Commercial contains about 476 million words with automatically generated syntactic annotations. The lemmas and POS tags were automatically added to the corpus using Tadpole (now: Frog). The syntactic dependency structures were added using Alpino.
By default, this language material is offered as a download and then there is no charge. But because of the large amount of data, the SoNaR corpus can also be requested on an external hard disk. For this the INT charges €100.00 shipping and handling fee.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Productdetails
Dataformaat | xml (compact) |
Documentatie | LREC2006-artikel; TLT2009-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2015 |
Opdrachtgever | NTU|STEVIN |
Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
Refereren | Lassy Groot-corpus Commercieel (Version 2.0) (2015) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-m7 |
Talen | Nederlands |
Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
Versie | 2.0 |
Downloaddetails
Bestand | |
---|---|
BP_LASSYGrootC.zip |
- Aantal bestanden 1
- Aantal downloads 18
- Bestandsgrootte 52.37 KB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 14/06/2024
- Versie 2.0