On
distingue deux types de codes de polices de caractères, les codes ANSI et
l’Unicode. Les codes ANSI des caractères alphabétiques cambodgiens ont été
créés depuis la fin des années 80 ou en début des années 90 et nous pouvons les
grouper en plusieurs familles. On peut citer la famille TS créées par Top Sidèn
et Sean Massavang, la famille Norkhvak créée par Touch Kim Sour et Thivet
Pierre , la famille New, ABC zero space, Limon. Comme elles ont été créées
par des personnes ou par des groupes de personnes différents (nous saluons au
passage leurs courages et leurs patiences), il n’y a aucune uniformité entre
ces familles : ni en codages internes de caractères, ni en tailles, ni en
disposition sur le clavier.
A
la différence des codes ANSI qui permettent de stocker seulement jusqu’à 256
caractères, Unicode peut aller jusqu’à 65536 caractères ce qui permet de
stocker tous les caractères du monde entier et du coup permet d’avoir un
standard universel. Le consortium internationale d’Unicode a réservé la place,
pour les caractères alphabétiques cambodgiens, entre les numéros 6016 (U1780)
et le numéro 6143 (U17FF) et entre les numéros 6624 (U19E0) et 6655 (U19FF)
suite à la décision du 17 March 1998. C’est grâce aux personnes comme Andy
Daniels, Michael Everson et de Paul Nelson qui ont fait des efforts de standardisation (excusez
nous si nous oublions d’autres personnes, envoyez nous un e-mail à a.y@free.fr ou à amanek@free.fr
). Les personnes comme Maurice Bauhahn
et Om Mony ont contribué à
l’élaboration des polices Unicode. Nous nous permettons d’inclure ci-dessous un
extrait d’un texte trouvé sur internet et rédigé par Maurice Bauhahn à propos
de khmer unicode :
Significant study, discussion, and debate went
into this encoding. Some key steps: UNESCO-sponsored conference in Phnom Penh
on Unicode (immediately after UNTAC), Khmer government sponsored meetings of
Khmer linguists in Cambodia (Report of 14 August 1996, pages: 1, 2, 3, 4, Rough English translation), Unicode sponsored mailing lists,
and discussions within an ISO subcommittee. There was a healthy debate at every
stage. A 1992 proposal by Andy Daniels, Unicode Technical Report #1 (http://www.unicode.org/unicode/reports/tr1.html and http://www.unicode.org/Public/TEXT/UTR-1.TXT), did not progress to the level of
a standard but heavily influenced what followed. I offered a number of
proposals and encodings: (14 March 1997, 17 March 1997, 30 July 1997, 20 September 1997, 13 March 1998). An ad hoc committee of the WG2
working group focused on the Khmer encoding proposals...and approved one to be
reviewed by the International Standards Organization members as a PDAM
(pre-draft amendment to ISO10646). That decision was made 17 March 1998. The
agenda of the ISO/IEC JTC 1/SC 2/WG 2 starting 30 June 1997 http://www.dkuug.dk/JTC1/SC2/WG2/docs/N1517.html
Discussions by the
ISO subcommittee led to documents dated: 18 March 1998 and 23 October 1998. A great debt is owed to Michael Everson
(everson at evertype.ie; http://www.evertype.com) and Paul Nelson (paulnel at
microsoft.com) who have worked very hard on the standardisation and
implementation respectively of Khmer Unicode. An OpenType specification for Khmer is now available on the Microsoft
site.
Si
vous voulez plus de renseignement, cliquer ici.
En
même temps, Microsoft, en la personne de Paul Nelson, a développé le moteur
d’affichage appelé uniscribe (usp10.dll) pour que nos textes en Unicode
s’affichent correctement sur ordinateur. Actuellement, si vous possédez Offices
2003 vous pouvez taper les textes sur les traitements de textes comme Word ou
Excel ou vous pouvez envoyer des e-mails ou créer des sites internet en Cambodgiens.
D’autres personnes peut lire vos sites ou lire vos e-mail à condition qu’elles
possèdent aussi Office 2003.
Ce
qui est regrettable est qu’il manque plusieurs voyelles essentielles (j’en ai
compté huit) dans le codage de ‘khmer Unicode’ alors qu’il nous reste encore de
la place réservée pour nous. Ces voyelles manquantes ne sont pas gênantes si
nous nous contentions de faire uniquement du traitement de textes simples. Mais
si nous voulons faire du traitement informatique de nos caractères alphabétiques,
comme par exemple faire des tris, il nous est impossible de le faire.