Het DPC-corpus (Dutch Parallel Corpus) is een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans. Het is bidirectioneel - het Nederlands is zowel brontaal als doeltaal - en een gedeelte van het corpus is drietalig, waarbij Nederlandse teksten vertalingen hebben naar het Engels én het Frans. DPC is gealigneerd op zinsniveau en verrijkt met taalkundige annotaties.
The DPC corpus (Dutch Parallel Corpus) is a parallel corpus of 10 million words for the language pairs Dutch-English and Dutch-French. It is bidirectional - Dutch is both the source and target language - and part of the corpus is trilingual, with Dutch texts having translations into English as well as French. DPC is aligned at sentence level and enriched with linguistic annotations (lemmas and POS tags).
Productdetails
Dataformaat | xml, html |
Eigenaar | Taalunie |
Financier | NTU|STEVIN |
ISBN/EAN nummer | 978-94-91325-00-7 |
Jaar | 2010 |
Opdrachtgever | NTU|STEVIN |
Originele publicaties | Algemeen: Paulussen, H., L. Macken, J. Truskina, P. Desmet en W. Vandeweghe (2006). "Dutch Parallel Corpus: a multifunctional and multilingual corpus". Cahiers de l'Institut de Linguistique de Louvain, CILL, Louvain-La-Neuve, 32.1-4, 269-285; Focus op vertaalstudies: Macken, L., De Clercq, O., & Paulussen, H. (2011). Dutch Parallel Corpus: a Balanced Copyright-Cleared Parallel Corpus. Meta, 56 (2), 374-390 |
Project | DPC: Dutch Parallel Corpus |
Refereren | Dutch Parallel Corpus - DPC (Version 1.0) (2010) [Data set]. Available at the Dutch Language Institute: https://hdl.handle.net/10032/tm-a2-h3 |
Talen | Nederlands, Engels, Frans |
Versie | 1.0 |
Downloaddetails
Bestand | |
---|---|
DutchParallelCorpus_Niet-commercieel_1.0p2.tgz |
- Aantal bestanden 1
- Aantal downloads 167
- Bestandsgrootte 292.84 MB
- Datum plaatsing 03/09/2020
- Laatst bijgewerkt 24/04/2025
- Versie 1.0