TICCLOPS: Text-Induced Corpus Clean-up online processing system TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914. Status: … [Lees meer...] overTICCLops
Grafzerk
RND Woordenlijsten
De Reeks Nederlandse Dialectatlassen is een serie boeken, uitgegeven tussen 1925 en 1976, met daarin de fonetische transcripties van een vast aantal zinnen. Daarbij is de uitspraak vastgelegd van zegslieden uit een groot aantal dorpen en steden in Nederland en Vlaanderen. De boeken zijn uitgegeven door uitgeverij De Sikkel, nu Van In. De volledige inhoud van die boeken is te … [Lees meer...] overRND Woordenlijsten
RBN-klein
Een verzameling van ongeveer 10.000 frequente Nederlandse woorden, afgeleid van het Referentiebestand Nederlands (RBN). Dit taalmateriaal is niet langer beschikbaar. A collection of about 10,000 frequent Dutch words, derived from the Referentiebestand Nederlands (RBN). This language material is no longer available. … [Lees meer...] overRBN-klein
RBN-klein Commercieel
Een verzameling van ongeveer 10.000 frequente Nederlandse woorden, afgeleid van het Referentiebestand Nederlands (RBN). Dit taalmateriaal is niet langer beschikbaar. A collection of about 10,000 frequent Dutch words, derived from the Referentiebestand Nederlands (RBN). This language material is no longer available. A collection of ca. 10,000 frequently used Dutch … [Lees meer...] overRBN-klein Commercieel
Moroccorp
Moroccorp is een corpus van communicatie via internet-chat tussen Marokkaans-Nederlandse taalgebruikers, bestaande uit tien miljoen woorden. De data wordt aangeboden als een tekstbestand van 82.4 Mb. Waarschuwing: Dit is niet de meest actuele versie van Moroccorp. De nieuwste versie is: Moroccorp 1.1. Moroccorp is a corpus of computer-mediated communication in … [Lees meer...] overMoroccorp