Qu'est-ce que ASCII, UNICODE et UTF-8. Le PC est un excellent calculateur, il ne fait que faire des calculs avec des nombres. Je ne comprends pas un texte. Par conséquent, les codes sont des moyens de transformer les informations textuelles en données numériques, compréhensibles par le PC.

Qu'est-ce que ASCII, UNICODE et UTF-8: codes

ASCII

Il existe différents codes Le plus connu est le code ASCII (Code américain normalisé pour l'échange d'information). Il s'agit d'une norme américaine, mais c'est l'une des plus utilisées au monde. Il Code ASCII définit précisément la correspondance entre les symboles et les nombres jusqu'au nombre 127.

Ainsi, le nombre 97 est utilisé pour représenter "a". Pour représenter le ?, le code 63 est utilisé. Certains d'entre eux (moins de 32) sont des codes de contrôle et ne doivent pas être affichés. Par exemple, le code 10 saute la ligne, le code 7 émet un bip sur le PC, entre autres fonctions.

Mais qu'en est-il caractères accentués? Oui, les Américains ne pensaient pas au reste du monde. Nous utilisons souvent les codes 128 à 255 pour les accents, mais les codes diffèrent d'un pays à l'autre. Il n'est pas pratique d'échanger des documents. Il nous a donc fallu trouver un code plus pratique: UNICODE.

UNICODE

Au lieu d'utiliser uniquement les codes 0 à 127, UNICODE utilise des codes de valeur beaucoup plus grande. Avec cela, vous pouvez représenter tous les caractères spécifiques multilingue. De nouveaux codes sont régulièrement attribués à de nouveaux caractères tels que le latin (accentué ou non), le grec, le cyrillique, l'arménien, l'hébreu, le thaï, l'hiragana, le katakana, etc. L'alphabet chinois kanji contient à lui seul 6.879 XNUMX caractères.

UNICODE définit une correspondance entre les symboles et les nombres. Même si UNICODE était bien développé, il était peu utilisé par rapport à ASCII. N'envoyez donc pas à quelqu'un un message UNICODE - il ne pourra probablement pas le lire. Même pour les programmeurs, ce n'est pas toujours facile à manipuler.

Bien que, nous pouvons le dire, ce modèle se développe de plus en plus. Les langues Java y Python sont déjà pris en charge par UNICODE. La plupart OS (Windows, Linux, MacOS X, etc.) sont également capables de le lire.

UNICODE en pratique: UTF-8

En théorie, UNICODE est très bon. Mais dans la pratique, l'histoire est différente. Généralement, dans UNICODE, un personnage utilise Octets 2. En d'autres termes, tout texte utilise deux fois plus d'espace qu'en ASCII. C'est un gaspillage. Les caractères qui nécessitent UNICODE sont rares. Mais il y a un truc: le UTF-8.

Un texte en UTF-8 est simple, il se fait entièrement en ASCII, et lorsque nous avons besoin d'un caractère UNICODE, nous utilisons un caractère spécial, qui dit «Attention, le caractère suivant est en UNICODE». Quoi qu'il en soit, pour être plus rigoureux, nous indiquons le début du fichier, qui est en UTF-8, avec des caractères spéciaux.

UTF-8 allie l'efficacité de l'ASCII et la portée d'UNICODE. En fait, UTF-8 a été adopté comme norme pour l'encodage Fichiers XML. La plupart des navigateurs actuels prennent également en charge UTF-8 et le détectent automatiquement sur les pages HTML.

Comment faire sur les pages Web

Si vous entrez directement le 'Oui sur une page Web, ce n'est pas bon. Vous devez choisir l'une de ces trois solutions:

Utilisez des entités HTML et mettez '> est' au lieu de 'si« ;

Quitter le 'si'de toute façon et spécifiez l'encodage de caractères que vous utiliserez au début du fichier HTML (dans la balise Head):

meta http-equiv = "Content-type" content = "text / html; charset =ISO-8859-1 "

(ISO-8859-1 est le jeu de caractères latins qui s'exécute sur Windows)

Travaillez directement en UTF-8 dans votre éditeur HTML (si possible). Ajoutez ensuite:

meta http-equiv = "Content-type" content = "text / html; charset = UTF-8"

ISO-8859-1 convient à la plupart des langues latines ou occidentales (anglais, français, allemand, espagnol, etc.) et UTF-8 sera indispensable pour d'autres langues (Japonais, hébreu, etc.).

Vous devez choisir l'une de ces trois options pour répondre à vos besoins.