Het Lassy Groot-corpus is een corpus van ongeveer 700 miljoen woorden met automatisch gegenereerde syntactische annotaties.
Informatie over de veranderingen in de verschillende versies is te vinden in de README.
Standaard wordt dit taalmateriaal als download aangeboden en dan zijn er geen kosten aan verbonden. Maar vanwege de grote hoeveelheid gegevens kan dit corpus ook op een externe harde schijf worden aangevraagd. Hiervoor brengt de INT €100,00 verzend- en administratiekosten in rekening.
The Lassy Large Corpus Commercial contains about 476 million words with automatically generated syntactic annotations.
Information about the changes between versions can be found in the README.
By default, this language material is offered as a download and then there is no charge. But because of the large amount of data, this corpus can also be requested on an external hard disk. For this the INT charges a €100.00 shipping and handling fee.
Productdetails
Dataformaat | xml (compact) |
Documentatie | LREC2006-artikel; TLT2009-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2016 |
Opdrachtgever | NTU|STEVIN |
Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
Refereren | Lassy Groot-corpus (Version 7.0) (2023) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-w8 |
Talen | Nederlands |
Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
Versie | 7.0 |
Downloaddetails
Bestand | |
---|---|
Lassy_Groot-corpus_Niet-commercieel_7.0.zip |
- Aantal bestanden 1
- Aantal downloads 55
- Bestandsgrootte 6.03 KB
- Datum plaatsing 19/10/2023
- Laatst bijgewerkt 26/11/2024
- Versie 4.0