Code ASCII

Les unités de traitement de l’information (ordinateur, API,…) doivent être capables de reconnaître des codes représentant des nombres, des lettres et des caractères spéciaux. Ces codes sont considérés comme des codes alphanumériques.

Le code ASCII (American Standard Code for Information Interchange) est le code alphanumérique le plus utilisé par les fabricants de matériels informatiques.

Il permet de coder les caractères les plus utilisés en langue anglaise : les lettres de l’alphabet en majuscule (de A à Z) et en minuscule (de a à z), les dix chiffres arabes (de 0 à 9), des signes de ponctuation (point, virgule, point-virgule, deux points, points d’exclamation et d’interrogation, apostrophe ou quote, guillemet, parenthèses, crochets etc.), quelques symboles et certains caractères spéciaux invisibles (espace, retour-chariot, tabulation, retour-arrière, etc.).

Les créateurs de ce code limitèrent le nombre de ses caractères à 128, c’est-à-dire 27 , pour qu’ils puissent être codés avec seulement 7 bits : les ordinateurs utilisaient des cases mémoires de un octet, mais ils réservaient toujours le 8ème bit pour le contrôle de parité (c’est une sécurité pour éviter les erreurs, qui étaient très fréquentes dans les premières mémoires électroniques – voir aussi transmission série RS232).

Table du code ASCII normalisé B6 0 0 0 0 1 1 1 1
B5 0 0 1 1 0 0 1 1
B4 0 1 0 1 0 1 0 1
  B3   B2   B1   B0 Poids fort Poids faible $0 $1 $2 $3 $4 $5 $6 $7
0 0 0 0 $0 NUL DLE SP 0 @ P ` p
0 0 0 1 $1 SOH DC1 ! 1 A Q a q
0 0 1 0 $2 STX DC2 «  2 B R b r
0 0 1 1 $3 ETX DC3 # 3 C S c s
0 1 0 0 $4 EOT DC4 $ 4 D T d t
0 1 0 1 $5 ENQ NAK % 5 E U e u
0 1 1 0 $6 ACK SYN & 6 F V f v
0 1 1 1 $7 BEL ETB 7 G W g w
1 0 0 0 $8 BS CAN ( 8 H X h x
1 0 0 1 $9 HT EM ) 9 I Y i y
1 0 1 0 $A LF SUB * : J Z j z
1 0 1 1 $B VT ESC + ; K [ k {
1 1 0 0 $C FF FS , < L \ l |
1 1 0 1 $D CR GS = M ] m }
1 1 1 0 $E SO RS . > N ^ n ~
1 1 1 1 $F SI US / ? O __ o DEL

 

Le tableau suivant représente la liste du code ASCII à 7 bits (b6b5b4b3b2b1b0) :

Exemple :

A = 100 0001(2) = 41(16) = 65(10)

 

Remarques :

  • Les codes de (00)H à (1F)H ne correspondent pas à des caractères imprimables. Ils sont utilisés comme caractères de contrôle ou de commande  (liste complète)
  • Le code d’une lettre minuscule s’obtient en ajoutant (20)H au code de la lettre majuscule.
  • Le code d’un chiffre décimal s’obtient en ajoutant (30)H à son code BCD.

 

 

 

 

 

 

 

 

Caractères de contrôle

Les 32 premiers caractères de la table ASCII sont des caractères de contrôle qui ne sont pas affichables :

  • NUL – Absence de caractère, blanc, espace.
  • SOH – ‘Start of Heading » : début d’en-tête.
  • STX – ‘Start of Text » : début du texte (et donc aussi fin de l’en-tète).
  • ETX – ‘End of Text » : fin d’un texte, commencé avec STX.
  • EOT – « End of Transmission » : fin de transmission.
  • ENQ – « Enquiry » : demande. Peut être utilisé pour demander au destinataire de s’identifier.
  • ACK – « Acknowledge » : accusé de réception.
  • BEL – « Ml » : sonnette.
  • BS – « Backspace »: marche arrière de 1 caractère.
  • HT – « Horizontale Tabulation » : tabulation horizontale.
  • LF – « Line Feed » : retour à une nouvelle ligne.
  • VT – « vertical Tabulation » : tabulation verticale.
  • FF – « Form Feed »: passage à une page suivante.
  • CR – « Carriage Return’: retour du chariot.
  • SO – « Shift Out »: le code suivant est hors des caractères standards. Se termine par « Shift In ».
  • SI – « Shift In »: retour aux caractères standards du code utilisé.
  • DLE – « Data Link Escape »: change la signification d’un ou plusieurs caractères suivants. Sert à fournir des commandes supplémentaires.
  • DC1. DC2, DC3 et DC4 – « Device Controls caractères de commande de terminaux ou périphériques.
  • NAK – « Negative Acknowledgment » : réponse négative à une question.
  • SYN – « Synchronus/ldle » : caractère de synchronisation ; lorsqu’un caractère est transmis, il peut être émis continûment.
  • ETB – « End of Transmission Block » : fin de transmission d’un bloc de données.
  • CAN – ‘ »Cancel » : annulation de la donnée précédente.
  • EM – « End of Medium » : fin physique de la carte, bande, ou autre support utilisé.
  • SUB – « Substitute » : remplacement.
  • ESC – « Escape » : caractère de contrôle fournissant un moyen d étendre les possibilités de codage.
  • FS – « File Separator » :
  • GS – « Groupe Separator » :
  • RS – « Record Separator » :
  • US – « United Separator » : caractères de séparation à utilisation optionnelle, mais hiérarchique, de FS (le plus général) à US.
  • SP – « Space » : espace, ou blanc.
  • DEL – « Delete » : suppression.

 

Activité : conversion
Convertir le code ASCII suivant en une chaîne de caractères.
0x53 0x63 0x69 0x65 0x6e 0x63 0x65 0x73 0x20 0x64 0x65 0x20 0x6c 0x27 0x69 0x6e 0x67 0x65 0x6e 0x69 0x65 0x75 0x72
×

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *