Extended Binary Coded Decimal Interchange Code - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Exemple de codage

Ce tableau représente le codage d’une variante d’EBCDIC compatible avec l’ISO 8859-1. Les caractères codés de 0x00 à 0x3F ainsi que 0xFF sont des caractères de contrôle, 0x40 est l’espace, 0x41 est l’espace insécable. Le caractère codé en 0x54 est le tiret de césure visible uniquement en fin de ligne.

Cette variante est compatible, octet par octet, avec l’UTF-EBCDIC qui utilise les positions variantes colorées en vert pour coder les caractères Unicode (hors de l’ASCII et des codes de contrôle) sous forme de séquences d’octets.

Chaque variante nationale ou internationale de l’EBCDIC est codée d’après cette table (cependant des permutations sont possibles entre deux CCSID pour les mêmes caractères). Toutes les variantes de l’EBCDIC ne codent pas les lettres minuscules latines de base, au contraire des jeux de caractères basés sur l’ISO 646 ou ISO 8859.

D’autre part certaines variantes nationales de l’ISO 646 (ou autres jeux de caractères compatibles avec cette norme) contiennent des positions variantes supplémentaires, invariantes dans les jeux de caractères basés sur l’EBCDIC.

Enfin, les positions 0x21 et 0x22 de l’EBCDIC sont variantes — la plupart codent le point d’exclamation et le guillemet anglais (double quote) — au contraire des caractères correspondants des variantes nationales de l’ISO 646.

Sur les systèmes EBCDIC, le saut de ligne est normalement codé avec le caractère de commande C1 “NEL” (U+0085 en Unicode, ou 0x25 dans toutes les variantes standard EBCDIC) et non avec les caractères de commande C0 “CR” et/ou “LF” de l’ISO 646 et de l’ASCII (U+000D et/ou U+000A, c’est-à-dire 0x0D et/ou 0x15 en EBCDIC, où ces commandes ont une fonction bien définie et unique de gestion de position du curseur sur un terminal, ou bien permettent de distinguer les sauts de lignes forcés dans un même paragraphe, ou encore permettaient d’afficher une ligne en surimpression pour produire des caractères gras, soulignés, ou accentués supplémentaires).

Jeu de caractères EBCDIC (variante compatible avec l’UTF-EBCDIC).
Quartet
haut
Quartet bas (toutes les valeurs sont en hexadécimal)
...0 ...1 ...2 ...3 ...4 ...5 ...6 ...7 ...8 ...9 ...A ...B ...C ...D ...E ...F
0...















1...















2...















3...















4...

¡
¢
£
¤
¥
¦
§
¨
©
.
<
(
+
|
5... &
ª
«
¬

®
¯
°
±
²
!
$
*
)
;
^
6... -
/
³
´
µ

·
¸
¹
º
»
,
%
_
>
?
7... ¼
½
¾
¿
À
Á
Â
Ã
Ä
`
:
#
@
'
=
"
8... Å
a
b
c
d
e
f
g
h
i
Æ
Ç
È
É
Ê
Ë
9... Ì
j
k
l
m
n
o
p
q
r
Í
Î
Ï
Ð
Ñ
Ò
A... Ó
~
s
t
u
v
w
x
y
z
Ô
Õ
Ö
[
×
Ø
B... Ù
Ú
Û
Ü
Ý
Þ
ß
à
á
â
ã
ä
å
]
æ
ç
C... {
A
B
C
D
E
F
G
H
I
è
é
ê
ë
ì
í
D... }
J
K
L
M
N
O
P
Q
R
î
ï
ð
ñ
ò
ó
E... \
ô
S
T
U
V
W
X
Y
Z
õ
ö
÷
ø
ù
ú
F... 0
1
2
3
4
5
6
7
8
9
û
ü
ý
þ
ÿ

Notes :

  • Les caractères de contrôle de l’EBCDIC sont indiqués sur fond rouge (commandes C0) ou mauve (commandes C1).
  • Les positions invariantes de de l’ISO 646 ou de l’ISO 8859 sont généralement invariantes dans les versions de l’EBCDIC. Elles sont indiquées en fond blanc.
  • Les positions variantes de l’EBCDIC indiquent en italique le point de code Unicode correspondant uniquement à cette variante :
    • Les caractères variants des différentes versions correspondantes de l’ISO 646 sont affichés sur fond jaune (le caractère affiché est celui de l’EBCDIC CCSID 500 ou de l’ASCII).
      • Le caractère “double quote” U+0022 (codé 0x7F dans la plupart des variantes de l’EBCDIC) n’est pas variant dans les jeux de caractères compatibles ISO 646, mais varie dans la version turque de l’EBCDIC.
      • Les minuscules latines U+0061 à U+007A (codées 0x81..0x89, 0x91..0x99, 0xA2..0xA9 dans la plupart des variantes de l’EBCDIC) ne sont pas variants dans les jeux de caractères compatibles ISO 646, mais varient dans les versions japonaises (hiragana/katakana) et cyrilliques de l’EBCDIC (qui y codent d’autres lettres nécessaires à ces écritures).
    • Les caractères variants des différentes versions étendues de l’EBCDIC sont affichés sur fond vert (le caractère affiché est celui de l’UTF-EBCDIC interprété comme caractère l’ISO 8859-1). Certains caractères étaient différents dans la version initiale de l’EBCDIC qui y plaçait des symboles spéciaux. Les variantes CCSID 037 et 500 les plus connues de l’EBCDIC y utilisent ainsi une assignation différente pour de tels symboles.
Page générée en 0.101 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise