• Door naar de hoofd inhoud
  • Skip to secondary menu
  • Spring naar de eerste sidebar

INT Taalmaterialen

Bronnen, data en tools voor
taalkundig onderzoek binnen het
Nederlandse taalgebied.

U bent ingelogd.

MENUMENU
  • Nieuw
  • Alle taalmaterialen
  • Over deze website
  • Mijn taalmaterialen
  • Registreren
  • Inloggen
  • Zoeken

AI-Trainingset – Tag de Tekst voor Named Entity Recognition (NER)

De AI-trainingset voor NER is in 2020 gemaakt door de circa 150 vrijwilligers van het crowdsourcingsproject "Tag de tekst" op VeleHanden.nl. Persoonsnamen, locaties en tijdsaanduidingen zijn geannoteerd in al eerder ontwikkelde Ground Truth-transcripties (GT-transcripties) van 10.567 scans en gecontroleerd door drie ervaren super users. Een uitgebreide beschrijving van de gehanteerde definities is te vinden in de invoerinstructie van "Tag de tekst". De Nederlandstalige teksten komen uit de 17e eeuw tot en met de 19e eeuw. Het gaat om notariƫle teksten uit Amsterdam, Haarlem en uit zeven andere provincies en archieven van de Verenigde Oost-Indische Compagnie (VOC). Ze zijn afkomstig uit het Stadsarchief Amsterdam, het Nationaal Archief, het Noord-Hollands Archief, en zeven andere Regionaal Historische Centra: Tresoar, het Gelders Archief, de Groningen Archieven, het Brabants Historisch Informatie Centrum, het Zeeuws Archief, het Historisch Centrum Limburg, Het Utrechts Archief en de Collectie Overijssel. De AI-trainingset is ontwikkeld i.h.k.v. de projecten "De IJsberg zichtbaar maken" (zoekintranscripties.nl) en "Slimmer zoeken in archieven" (archieveninbeeld.nl).

Productdetails

Dataformaat XML
Jaar 2022
Project "Tag de Tekst" op VeleHanden.nl
Gerealiseerd door Picturae, Aincient, Sioux Technologies, Islands of Meaning, de deelnemende archieven en vrijwilligers van VeleHanden.nl
Documentatie Toelichting
Refereren AI-Trainingset for NER (Version 1.0) (2022) [Data set]. Available at the Dutch Language Institute: http://hdl.handle.net/10032/tm-a2-v2
Talen Nederlands
Licentie Creative Commons-Licentie Creative Commons Naamsvermelding 4.0 Internationaal-licentie
Versie 1.0

Downloaddetails


Bestand
AITrainingset1.0.zip
  • Aantal bestanden 1
  • Aantal downloads 29
  • Bestandsgrootte 12.90 MB
  • Datum plaatsing 18/05/2022
  • Laatst bijgewerkt 31/01/2023
  • Versie 1.0
Log in om te downloaden

Primaire Sidebar

Zoek op naam / tags

  • Disclaimer
  • Privacy Policy

© 2023 — Instituut voor de Nederlandse Taal — Contact: taalmaterialen@ivdnt.org

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Op deze website maken wij gebruik van cookies. Lees meerIk ga akkoord
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Altijd ingeschakeld
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
OPSLAAN & ACCEPTEREN
Naar de inhoud springen
Toolbar openen Toegankelijkheid

Toegankelijkheid

  • Vergroot tekstVergroot tekst
  • Verklein tekstVerklein tekst
  • GrijstintenGrijstinten
  • Hoog contrastHoog contrast
  • Negatief contrastNegatief contrast
  • Lichte achtergrondLichte achtergrond
  • Links onderstreeptLinks onderstreept
  • Leesbaar fontLeesbaar font
  • Terugzetten Terugzetten