CELEX is ontwikkeld in een samenwerkend verband tussen de Universiteit van Nijmegen, het Instituut voor de Nederlandse Lexicologie (tegenwoordig het Instituut voor de Nederlandse Taal - INT), het Max Planck Instituut voor Psycholinguïstiek in Nijmegen en het Instituut voor Perceptie Onderzoek te Eindhoven. De oorspronkelijke versie verscheen op cd-rom en bevatte ASCII-versies van de databases voor Engels (Versie 2.5), Nederlands (Versie 3.1) en Duits (Versie 2.0).
De huidige dataset bevat alleen de data voor het Nederlands en heeft uitgebreide informatie over
- orthografie (spellingvariaties, afbreking)
- fonologie (fonetische transcripties, uitspraakvarianten, syllabestructuur, klemtoon)
- morfologie (derivatie- en compositiestructuren, vervoeging)
- grammatica (woordklassen en -subklassen, argumentstructuren)
- woordfrequentie (tellingen op woord- en lemmaniveau, gebaseerd op hedendaagse tekstcorpora)
CELEX was developed as a joint enterprise of the University of Nijmegen, the Institute for Dutch Lexicology in Leiden (now Dutch Language Institute - INT), the Max Planck Institute for Psycholinguistics in Nijmegen, and the Institute for Perception Research in Eindhoven. It originally was published on CD-ROM and contained ASCII versions of the CELEX lexical databases of English (Version 2.5), Dutch (Version 3.1) and German (Version 2.0).
The present dataset only contains the data for Dutch and has detailed information on:
- orthography (variations in spelling, hyphenation)
- phonology (phonetic transcriptions, variations in pronunciation, syllable structure, primary stress)
- morphology (derivational and compositional structure, inflectional paradigms)
- syntax (word class, word class-specific subcategorizations, argument structures)
- word frequency (summed word and lemma counts, based on contemporary text corpora)
For a full version of CELEX-2, including data for English and German, see the catalog of LDC.
The data can also be consulted via an online application: WebCelex.
Productdetails
Dataformaat | text/ASCII |
Eigenaar | INT |
Jaar | 1995 |
Opdrachtgever | INT |
Refereren | Baayen, R H., R Piepenbrock, and L Gulikers. CELEX-2 Dutch (Version 2.0) (1995) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-w5 |
Talen | Nederlands |
Versie | 2.0 |
Licentie | Creative Commons Attribution 4.0 International License. |
Downloaddetails
Bestand | |
---|---|
celex-2-nl.zip |
- Aantal bestanden 1
- Aantal downloads 101
- Bestandsgrootte 12.90 MB
- Datum plaatsing 15/08/2023
- Laatst bijgewerkt 17/06/2024
- Versie 2.0