Het Lassy Groot-corpus Commercieel is een corpus van ongeveer 476 miljoen woorden met automatisch gegenereerde syntactische annotaties.
Informatie over de veranderingen in de verschillende versies is te vinden in de README.
Standaard wordt dit taalmateriaal als download aangeboden en dan zijn er geen kosten aan verbonden. Maar vanwege de grote hoeveelheid gegevens kan dit corpus ook op een externe harde schijf worden aangevraagd. Hiervoor brengt het INT €100,00 verzend- en administratiekosten in rekening.
The Lassy Large Corpus Commercial contains about 476 million words with automatically generated syntactic annotations.
Information about the changes between versions can be found in the README.
By default, this language material is offered as a download and then there is no charge. But because of the large amount of data, this corpus can also be requested on an external hard disk. For this the INT charges a €100.00 shipping and handling fee.
This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.
Dataformaat | xml (compact) |
Documentatie | LREC2006-artikel; TLT2009-artikel |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
Jaar | 2023 |
Opdrachtgever | NTU|STEVIN |
Project | LASSY: Large Scale Syntactic Annotation of written Dutch |
Projectwebsite | http://www.let.rug.nl/~vannoord/Lassy/ |
Refereren | Lassy Groot-corpus Commercieel (Version 7.0) (2023) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-z7 |
Talen | Nederlands |
Toepassing | Waardevol voor o.a. taalkundig onderzoek (bv. zinsbouw) en als referentiemateriaal bij het maken van woordenboeken of lexica. |
Versie | 7.0 |
Bestand | |
BP_LassyGroot-corpus_C.zip |
- Aantal bestanden 1
- Aantal downloads 25
- Bestandsgrootte 52.37 KB
- Datum plaatsing 03/10/2024
- Laatst bijgewerkt 17/10/2024
- Versie 2.0