• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar

INT Taalmaterialen

Bronnen, data en tools voor
taalkundig onderzoek binnen het
Nederlandse taalgebied.

U bent ingelogd.

MENUMENU
  • Nieuw
  • Alle taalmaterialen
  • Over deze website
  • Mijn taalmaterialen
  • Registreren
  • Inloggen
  • Zoeken

Corpus Gesproken Nederlands (CGN) Commercieel

Het Corpus Gesproken Nederlands (CGN) is een verzameling van 900 uur (bijna 9 miljoen woorden) hedendaags Nederlandse spraak, afkomstig van Vlamingen en Nederlanders. De spraakfragmenten (spontaan en voorbereid) zijn opgelijnd met diverse transcripties (o.a. orthografisch, fonetisch) en annotaties (o.a. syntactisch, POS-tags).  Metadata, lexica, frequentielijsten en de (verouderde) corpusexploratiesoftware Corex behoren ook tot het CGN.

Naast het Corpus Gesproken Nederlands zijn de CGN-annotaties ook apart te verkrijgen. Deze annotaties zijn identiek aan het volledige Corpus Gesproken Nederlands, maar dan zonder de geluidsbestanden.

Vanwege de hoeveelheid data kan dit product ook aangevraagd worden op een externe harde schijf. Hier rekent het INT €100,00 verzend- en afhandelingskosten voor.

A collection of about 900 hours standard Dutch as spoken by adults in The Netherlands and Flanders. The speech fragments (spontaneous and prepared) are lined up with various transcriptions (including orthographic, phonetic) and annotations (including syntactic, POS tags). Metadata, lexica, frequency lists and the (outdated) corpus exploration software Corex are also part of the CGN.

By default, this language material is offered as a download and then there is no charge. But because of the large amount of data, the SoNaR corpus can also be requested on an external hard disk. For this the INT charges €100.00 shipping and handling fee.

Dit product is gratis. Maar het is wel noodzakelijk dat eerst een licentie wordt ondertekend. De download bevat de licentie en verdere instructies voor het plaatsen van een bestelling.

This product is free of charge. However, it is necessary to sign a license first. The download contains the license and further instructions for placing an order.

Productdetails

Aantal uren spraak 900
Dataformaat Spraakbestanden (wav), annotaties (xml en txt)
Documentatie Over het Corpus Gesproken Nederlands (pdf) Zoekacties en codes in het CGN (pdf), en de interactieve documentatie (verwijzingen naar de data zijn niet actief).
Eigenaar Taalunie
Financier Vlaamse en Nederlandse regering en NWO
Jaar 2014
Opdrachtgever NWO/NTU
Project Corpus Gesproken Nederlands
Refereren Corpus Gesproken Nederlands - CGN Commercieel (Version 2.0.3) (2014) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-d9
Software Corex
Talen Nederlands, Vlaams
Toepassing Onderzoek, testen van spraakherkenners
Webcursus CGN-webcursus
Versie 2.0.3

Downloaddetails


Bestand
BP_CGN_C.zip
  • Aantal bestanden 1
  • Aantal downloads 78
  • Bestandsgrootte 51.46 KB
  • Datum plaatsing 03/09/2020
  • Laatst bijgewerkt 02/03/2023
  • Versie 2.0.3
Log in om te downloaden

Primaire Sidebar

Zoek op naam / tags

  • Disclaimer
  • Privacy Policy

© 2023 — Instituut voor de Nederlandse Taal — Contact: taalmaterialen@ivdnt.org

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Op deze website maken wij gebruik van cookies. Lees meerIk ga akkoord
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Altijd ingeschakeld
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
OPSLAAN & ACCEPTEREN
Naar de inhoud springen
Toolbar openen Toegankelijkheid

Toegankelijkheid

  • Vergroot tekstVergroot tekst
  • Verklein tekstVerklein tekst
  • GrijstintenGrijstinten
  • Hoog contrastHoog contrast
  • Negatief contrastNegatief contrast
  • Lichte achtergrondLichte achtergrond
  • Links onderstreeptLinks onderstreept
  • Leesbaar fontLeesbaar font
  • Terugzetten Terugzetten