PICCL biedt een workflow aan voor het samenstellen van corpora waarbij een aantal bestaande tools zijn samengevoegd. Het belangrijkste onderdeel van PICCL is TICCL, een systeem voor het opschonen van tekst gebruikmakend van spellingcorrectie en het nabewerken van OCR (normalisering van spellingvarianten etc.)
(alleen toegankelijk met een CLARIN-login).
PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL, a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
(only accessible with a CLARIN login)
Productdetails
Financier | KNAW, NWO |
Jaar | 2018 |
Producttype | Online service |
Project | CLARIAH |
Refereren | Philosophical Integrator of Computational and Corpus Libraries - PICCL (2018) [Online service]. Avalable at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-a2 |
Talen | Nederlands |
Toepassing | Corpusbouw, spellingcorrectie |
Details
- Aantal bestanden 0
- Aantal downloads
- Bestandsgrootte 0.00 KB
- Datum plaatsing 02/09/2020
- Laatst bijgewerkt 14/06/2024
- Versie