Pôle traitement informatique

Home

On distingue deux types de codes de polices de caractères, les codes ANSI et l’Unicode. Les codes ANSI des caractères alphabétiques cambodgiens ont été créés depuis la fin des années 80 ou en début des années 90 et nous pouvons les grouper en plusieurs familles. On peut citer la famille TS créées par Top Sidèn et Sean Massavang, la famille Norkhvak créée par Touch Kim Sour et Thivet Pierre , la famille New, ABC zero space, Limon. Comme elles ont été créées par des personnes ou par des groupes de personnes différents (nous saluons au passage leurs courages et leurs patiences), il n’y a aucune uniformité entre ces familles : ni en codages internes de caractères, ni en tailles, ni en disposition sur le clavier.

A la différence des codes ANSI qui permettent de stocker seulement jusqu’à 256 caractères, Unicode peut aller jusqu’à 65536 caractères ce qui permet de stocker tous les caractères du monde entier et du coup permet d’avoir un standard universel. Le consortium internationale d’Unicode a réservé la place, pour les caractères alphabétiques cambodgiens, entre les numéros 6016 (U1780) et le numéro 6143 (U17FF) et entre les numéros 6624 (U19E0) et 6655 (U19FF) suite à la décision du 17 March 1998. C’est grâce aux personnes comme Andy Daniels, Michael Everson et de Paul Nelson qui ont fait des efforts de standardisation (excusez nous si nous oublions d’autres personnes, envoyez nous un e-mail à a.y@free.fr ou à amanek@free.fr ). Les personnes comme Maurice Bauhahn et Om Mony ont contribué à l’élaboration des polices Unicode. Nous nous permettons d’inclure ci-dessous un extrait d’un texte trouvé sur internet et rédigé par Maurice Bauhahn à propos de khmer unicode :

Significant study, discussion, and debate went into this encoding. Some key steps: UNESCO-sponsored conference in Phnom Penh on Unicode (immediately after UNTAC), Khmer government sponsored meetings of Khmer linguists in Cambodia (Report of 14 August 1996, pages: 1, 2, 3, 4, Rough English translation), Unicode sponsored mailing lists, and discussions within an ISO subcommittee. There was a healthy debate at every stage. A 1992 proposal by Andy Daniels, Unicode Technical Report #1 (http://www.unicode.org/unicode/reports/tr1.html and http://www.unicode.org/Public/TEXT/UTR-1.TXT), did not progress to the level of a standard but heavily influenced what followed. I offered a number of proposals and encodings: (14 March 1997, 17 March 1997, 30 July 1997, 20 September 1997, 13 March 1998). An ad hoc committee of the WG2 working group focused on the Khmer encoding proposals...and approved one to be reviewed by the International Standards Organization members as a PDAM (pre-draft amendment to ISO10646). That decision was made 17 March 1998. The agenda of the ISO/IEC JTC 1/SC 2/WG 2 starting 30 June 1997 http://www.dkuug.dk/JTC1/SC2/WG2/docs/N1517.html Discussions by the ISO subcommittee led to documents dated: 18 March 1998 and 23 October 1998. A great debt is owed to Michael Everson (everson at evertype.ie; http://www.evertype.com) and Paul Nelson (paulnel at microsoft.com) who have worked very hard on the standardisation and implementation respectively of Khmer Unicode. An OpenType specification for Khmer is now available on the Microsoft site.

Si vous voulez plus de renseignement, cliquer ici.

En même temps, Microsoft, en la personne de Paul Nelson, a développé le moteur d’affichage appelé uniscribe (usp10.dll) pour que nos textes en Unicode s’affichent correctement sur ordinateur. Actuellement, si vous possédez Offices 2003 vous pouvez taper les textes sur les traitements de textes comme Word ou Excel ou vous pouvez envoyer des e-mails ou créer des sites internet en Cambodgiens. D’autres personnes peut lire vos sites ou lire vos e-mail à condition qu’elles possèdent aussi Office 2003.

Ce qui est regrettable est qu’il manque plusieurs voyelles essentielles (j’en ai compté huit) dans le codage de ‘khmer Unicode’ alors qu’il nous reste encore de la place réservée pour nous. Ces voyelles manquantes ne sont pas gênantes si nous nous contentions de faire uniquement du traitement de textes simples. Mais si nous voulons faire du traitement informatique de nos caractères alphabétiques, comme par exemple faire des tris, il nous est impossible de le faire.