De INT Historische Woordenlijst bestaat uit 2 lijsten met ieder ca. 500.000 historische woordvormen ten behoeve van OCR en OCR-postcorrectie, voor de periode ca. 1550 - ca. 1970. Zie voor een evaluatie van het gebruik van het lexicon in OCR dit paper.
The INT Historische Woordenlijst consists of 2 lists, each containing about 500,000 historical word forms for the purpose of OCR and OCR post correction, for the period ca. 1550 - ca. 1970. For an evaluation of the use of the lexicon in OCR, see this paper.
Productdetails
Dataformaat | txt |
Eigenaar | INT |
Jaar | 2012 |
Project | IMPACT: Improving Access to Text |
Refereren | INT Historische Woordenlijst (Version 1.1) (2012) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-a6 |
Talen | Nederlands |
Versie | 1.1 |
Downloaddetails
Bestand | |
---|---|
INT_Historische_Woordenlijst_1.1.zip |
- Aantal bestanden 1
- Aantal downloads 95
- Bestandsgrootte 4.50 MB
- Datum plaatsing 02/09/2020
- Laatst bijgewerkt 21/03/2025
- Versie 1.1