Orthografische Transcriptie

Informatie

De orthografische transcriptie in het CGN is een woordelijke weergave in gewone spelling (orthografische symbolen) van wat er gezegd is. Ook is vastgelegd welke spreker wat gezegd heeft.

Uitgebreide info
De orthografische transcriptie van het CGN is een woordelijke neerslag van hetgeen er gezegd is en door welke spreker het gezegd werd. De transcriptie van de spraakdata sluit nauw aan op de officiƫle Nederlandse spelling (1995). Op bepaalde punten wordt er echter afgeweken van de spellingsregels of is er extra informatie toegevoegd:

Herhalingen, (opzettelijke) versprekingen, aarzelingen en dergelijke zijn uitgeschreven. De transcripties zijn opgedeeld per spreker, zodat makkelijk terug te vinden is welke uiting door welke spreker werd geproduceerd. Onverstaanbare spraakdata is aangeduid met "xxx" of "Xxx". Sprekergeluiden zoals lachen, hoesten of diep zuchten zijn gemarkeerd als "ggg". Vreemde woorden (afkomstig uit een andere taal), dialectwoorden en versprekingen zijn tevens gemarkeerd.
Alle markeringen zijn evenals alle woorden en zinsconstructies traceerbaar in het corpus. Op deze manier wordt de transcriptie maximaal consistent en bruikbaar voor allerlei verschillende wetenschappelijke doeleinden. Lees voor meer gedetailleerde informatie het protocol voor de orthografische transcriptie.

Zoeken op de orthografische transcriptie in Corex
Met behulp van Corex kunt u in de "Content Search" zoeken in de orthografische transcripties. U vindt deze tool in het hoofdmenu van het Corex-openingsvenster onder "Search".

Voorbeeld Corex Search : orthografie

Zoeken op een bepaald woord doet u door het woord in het scherm in te voeren. Let op dat de annotatielaag "orthography" geselecteerd staat. Voor het zoeken naar dialectwoorden of bijvoorbeeld versprekingen verandert u de annotatielaag in "marked" en selecteert u na "Annotation on tier marked matches" "dialect", respectievelijk "mispr". U kunt ook uw zoekactie verfijnen door er nog een criterium aan toe te voegen (add new constraint). Zo heeft u bijvoorbeeld de mogelijkheid om op woordcombinaties te zoeken, bijvoorbeeld zoeken op uitingen waarin de woorden "heb" en "gehad" voorkomen.