Bestanden van het type .lex (Lexicon), te vinden in /data/lexicon/xml/, bevatten het CGN-lexicon in XML-tekstformaat. Voor een uitgebreide beschrijving van dit formaat wordt verwezen naar /doc_Dutch/topics/lexicon/lexicon.htm, lex.dtd en mlex.dtd.
Alle in dit formaat gebruikte tekens uit de ISO-8859.1-tekenset die buiten het 7-bitsbereik vallen, zijn vertaald volgens de Character entity references for ISO 8859-1 characters. De gebruikte subset van deze speciale tekens is te vinden in bovengenoemde DTD's. In entities.htm vindt men een overzicht van de verschillende standaarden voor deze teken(sub)set.