Het DPC-corpus (Dutch Parallel Corpus) is een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans. Het is bidirectioneel - het Nederlands is zowel brontaal als doeltaal - en een gedeelte van het corpus is drietalig, waarbij Nederlandse teksten vertalingen hebben naar het Engels én het Frans. DPC is gealigneerd op zinsniveau en verrijkt met taalkundige annotaties.
A parallel corpus of 10 million words for the language pairs Dutch-English and Dutch-French.
Productdetails
Dataformaat | xml, html |
Demo | Tijdelijk niet beschikbaar |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
ISBN/EAN nummer | 978-94-91325-00-7 |
Jaar | 2010 |
Opdrachtgever | NTU|STEVIN |
Originele publicaties | Algemeen: Paulussen, H., L. Macken, J. Truskina, P. Desmet en W. Vandeweghe (2006). "Dutch Parallel Corpus: a multifunctional and multilingual corpus". Cahiers de l'Institut de Linguistique de Louvain, CILL, Louvain-La-Neuve, 32.1-4, 269-285; Focus op vertaalstudies: Macken, L., De Clercq, O., & Paulussen, H. (2011). Dutch Parallel Corpus: a Balanced Copyright-Cleared Parallel Corpus. Meta, 56 (2), 374-390 |
Project | DPC: Dutch Parallel Corpus |
Refereren | Dutch Parallel Corpus - DPC (Version 1.0) (2010) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-h3 |
Talen | Nederlands, Engels, Frans |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
dpc1.0p2.tgz |
- Aantal bestanden 1
- Aantal downloads 156
- Bestandsgrootte 292.84 MB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 11/10/2024
- Versie 1.0