Unicode

Le sigle CJC désigne les écritures chinoise, japonaise et coréenne, qui utilisent toutes les trois les caractères Han, caractères chinois dits hanzi en chinois, kanji en japonais, ou hanja en coréen, ainsi que des caractères nationaux. La polémique concerne surtout le chinois simplifié (de République Populaire de Chine et, officiellement Singapour et Hong-Kong), le chinois traditionnel (à Taiwan, Singapour, Hong-Kong et en Corée) et le japonais. ...Wikipedia "Codage des caractères chinois"

Un nom de domaine internationalisé est un nom de domaine Internet qui contient (potentiellement) des caractères non- ASCII. De tels noms de domaines peuvent contenir des signes diacritiques contenus dans beaucoup de langages européens, ou des caractères non-latins comme l' alphabet arabe. ...Wikipedia "Nom de domaine internationalisé"

Punycode (littéralement «code chétif») est une syntaxe de codage simple définie dans la RFC 3492 et conçue pour être utilisé en adéquation avec les noms de domaines internationalisés dans les applications les supportant (cf RFC 3490). ...Wikipedia "Punycode"

* Unicode 5.0 BETA Charts (version publique béta), sur le site officiel Unicode. ...Wikipedia "Table des caractères Unicode"

Certains systèmes d'écritures, tels que l' alphabet arabe et hébreu, s'écrivent de droite à gauche (Right-To-Left, RTL, en anglais). Dans ce cas le texte commence du côté droit de la page et se termine du côté gauche, au contraire du sens d'écriture conventionnel de gauche à droite (Left-To-Right, LTR) des langues utilisant l' alphabet latin (telles que le français). Lorsqu'un texte LTR est mélangé avec un texte RTL dans le même paragraphe, chaque type de texte doit être écrit dans son propre sens, phénomène connu sous le nom de texte bi-directionnel. ...Wikipedia "Texte bi-directionnel"

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d' écriture de langue un nom et un identifiant numérique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel. ...Wikipedia "Unicode"

Le Projet Unihan est un tentative d'unification des caractères Han ou hanzi. C'est le processus employé par les auteurs de Unicode et UCS pour transcrire le jeu multi-caratère du langage CJK en un jeu de mono-caractère unifié. Les caractères chinois sont communs à la Chinois ( hanzi), Japonais ( kanji), et Coréen ( hanja). ...Wikipedia "UniHan" Everybody should like fr.shortopedia.com

UTF-16 est un codage des caractères définis par Unicode où chaque caractère est codé sur une suite de un ou deux mots de 16 bits. ...Wikipedia "UTF-16"

UTF-32 est un codage des caractères définis par Unicode où chaque caractère est codé sur un mot de 32 bits. ...Wikipedia "UTF-32"

UTF-8 (UCS transformation format 8 bits) est un format de codage de caractères défini pour les caractères Unicode (UCS). Chaque caractère est codé sur une suite de un à quatre octets. UTF-8 a été conçu pour être compatible avec certains logiciels originellement prévus pour traiter des caractères d'un seul octet. ...Wikipedia "UTF-8"

This article is licensed under the GNU Free Documentation License.
It uses material from the Wikipedia . Direct links to the original articles are in the text.
If you use exact copy or modified of this article you should preserve above paragraph and put also : It uses material from the Shortopedia article about "Unicode".
MAIN PAGE MAIN INDEX CONTACT US