L’Unicode : un standard informatique pour réaliser des échanges de textes dans différentes langues


Standard informatique permettant d’échanger des textes dans différentes langues, Unicode  est basé sur l’encodage à l’aide de différents systèmes d’écriture. Il permet l’utilisation de tous les caractères à partir de tous types de langue en mettant l’accent sur une forme standardisée.  À partir d’une source, comme un fichier texte ou une page web, ce standard informatique donne accès à la lecture ou à l’écriture de ces différents caractères.

 

La standardisation de l’Unicode

unicode.jpg

Actuellement, Unicode est considéré comme le standard de référence en termes de codage informatique des caractères. Présentant l’avantage de résoudre les problèmes d’interopérabilité, il présente aussi des limites en termes de standardisation. D’une manière générale, le codage de tous les textes ne s’effectue pas de la même façon. En effet, si certains adoptent la convention NFC, d’autres ont recours à la convention NFD. Pour ce qui est de normes, Unicode respecte l’ISO /CEI 10646 soulignant que les textes conformes à une version antérieure doivent garder cette conformité. Toutefois, cette norme ne se montre pas exigeante ni en termes de composition de caractères,  ni en matière des propriétés des caractères. Pour la version Unicode 3.0, les caractères sont définis par la norme ISO/CEI 10646 / 2000.

 

Les polices de caractères

les-polices-de-caracteres.jpg

Le choix des polices de caractères Unicode impose généralement la prudence. Il ne faut pas se contenter du fait de disposer d’une police correspondant à des représentations graphiques. Il faut aussi veiller à ce que le système d’affichage adopte des mécanismes de représentation adaptés. Par définition, une police de caractères désigne une police donnant accès à l’affichage direct d’un texte codé à l’aide des formes permises par Unicode. Un seul caractère peut généralement être codé de deux manières différentes ou encore plus. À noter qu’Unicode se limite aux polices de caractères et ne peut pas s’appliquer sur les représentations graphiques.