Código ASCII

CODIGO ASCII

ASCII (acrónimo inglés de American Standard Code for Information Interchange — Código Estándar Estadounidense para el Intercambio de Información), pronunciado generalmente [áski]1 :6 o [ásci] o [ásqui], es un código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno. Fue creado en 1963 por el Comité Estadounidense de Estándares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estándares Nacionales, o ANSI) como una refundición o evolución de los conjuntos de códigos utilizados entonces en telegrafía. Más tarde, en 1967, se incluyeron las minúsculas, y se redefinieron algunos códigos de control para formar el código conocido como US-ASCII.

El código ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisión. A menudo se llama incorrectamente ASCII a otros códigos de caracteres de 8 bits, como el estándar ISO/IEC 8859-1, que es una extensión que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al inglés, como el español.1

ASCII fue publicado como estándar por primera vez en 1967 y fue actualizado por última vez en 1986. En la actualidad define códigos para 32 caracteres no imprimibles, de los cuales la mayoría son caracteres de control que tienen efecto sobre cómo se procesa el texto, más otros 95 caracteres imprimibles que les siguen en la numeración (empezando por el carácter espacio).

Casi todos los sistemas informáticos actuales utilizan el código ASCII o una extensión compatible para representar textos y para el control de dispositivos que manejan texto como el teclado

Historia:

El código ASCII se desarrolló en el ámbito de la telegrafía y se usó por primera vez comercialmente como un código de tele impresión impulsado por los servicios de datos de Bell. Bell había planeado usar un código de seis bits, derivado de Fieldata, que añadía puntuación y letras minúsculas al más antiguo código de tele impresión Baudot, pero se les convenció para que se unieran al sub comité de la Agencia de Estándares Estadounidense (ASA), que había empezado a desarrollar el código ASCII. Baudot ayudó en la automatización del envío y recepción de mensajes telegráficos, y tomó muchas características del código Morse; sin embargo, a diferencia del código Morse, Baudot usó códigos de longitud constante. Comparado con los primeros códigos telegráficos, el código propuesto por Bell y ASA resultó en una reorganización más conveniente para ordenar listas (especialmente porque estaba ordenado alfabéticamente) y añadió características como la 'secuencia de escape'. La Agencia de Estándares Estadounidense (ASA), que se convertiría más tarde en el Instituto Nacional Estadounidense de Estándares (ANSI), publicó por primera vez el código ASCII en 1963. El ASCII publicado en 1963 tenía una flecha apuntando hacia arriba (↑) en lugar del circunflejo (^) y una flecha apuntando hacia la izquierda en lugar del guion bajo (_). La versión de 1967 añadió las letras minúsculas, cambió los nombres de algunos códigos de control y cambió de lugar los dos códigos de control ACK y ESC de la zona de letras minúsculas a la zona de códigos de control. ASCII fue actualizado en consecuencia y publicado como ANSI X3.4-1968, ANSI X3.4-1977, y finalmente ANSI X3.4-1986. Otros órganos de estandarización han publicado códigos de caracteres que son idénticos a ASCII. Estos códigos de caracteres reciben a menudo el nombre de ASCII, a pesar de que ASCII se define estrictamente solamente por los estándares ASA/ANSI.

¿Qué es el código ASCII?

La memoria de un ordenador guarda toda la información en formato digital. No hay forma de almacenar caracteres directamente. Cada uno de los caracteres tiene un código digital equivalente. Esto se denomina código ASCII. El código ASCII básico representaba caracteres utilizando 7 bits (para 128 caracteres posibles, enumerados del 0 al 127). 

Los códigos del 0 al 31 no se utilizan para caracteres. Estos se denominan caracteres de control, ya que se utilizan para acciones como retorno de carro (CR) y timbre (BEL). Los códigos del 65 al 90 representan las letras mayúsculas. Los códigos del 97 al 122 representan las letras minúsculas 

(si cambiamos el 6º bit, se pasa de mayúscula a minúscula; esto equivale a agregar 32 al código ASCII en base decimal). 

Tabla de caracteres ASCII

CaracterCódigo ASCIICódigo hexadecimal
NUL (Null)000
SOH (Start of heading)101
STX (Start of text)202
ETX (End of text)303
EOT (End of transmission)404
ENQ (Enquiry)505
ACK (Acknowledge)606
BEL (Bell)707
BS (Backspace)808
TAB (Horizontal tabulation, tabulación horizontal)909
LF (Line Feed, salto de línea)100A
VT (Vertical tabulation, tabulación vertical)110B
FF (Form feed)120C
CR (Carriage return, retorno de carro)130D
SO (Shift out)140E
SI (Shift in)150F
DLE (Data link escape)1610
DC1 (Device control 1)1711
DC2 (Device control 2)1812
DC3 (Device control 3)1913
DC4 (Device control 4)2014
NAK (Negative acknowledgement)2115
SYN (Synchronous idle)2216
ETB (End of transmission block, fin de bloque de transmisión)2317
CAN (Cancel, cancelar)2418
EM (End of medium, fin de medio)2519
SUB (Substitute, sustituto)261A
ESC (Escape, carácter de escape)271B
FS (File separator, separador de archivos)281C
GS (Group separator, separador de grupo)291D
RS (Record separator, separador de registros)301E
US (Unit separator, separador de unidades)311F
SP (Space, espacio)3220
!3321
"3422
#3523
$3624
%3725
&3826
'3927
(4028
)4129
*422A
+432B
,442C
-452D
.462E
/472F
04830
14931
25032
35133
45234
55335
65436
75537
85638
95739
:583A
;593B
<603C
=613D
>623E
?633F
@6440
A6541
B6642
C6743
D6844
E6945
F7046
G7147
H7248
I7349
J744A
K754B
L764C
M774D
N784E
O794F
P8050
Q8151
R8252
S8353
T8454
U8555
V8656
W8757
X8858
Y8959
Z905A
[915B
\925C
]935D
^945E
_955F
'9660
a9761
b9862
c9963
d10064
e10165
f10266
g10367
h10468
i10569
j1066A
k1076B
l1086C
m1096D
n1106E
o1116F
p11270
q11371
r11472
s11573
t11674
u11775
v11876
w11977
x12078
y12179
z1227A
{1237B
1247C
}1257D
~1267E
Tecla de borrar1277F


Tabla de caracteres ASCII extendido

El ASCII se desarrolló para utilizarse con el idioma inglés. No posee caracteres acentuados, o caracteres específicos de otros idiomas. Para codificar estos caracteres, se necesitaba un sistema de códigos distinto. El código ASCII se extendió a 8 bits (el equivalente a un byte) a fin de codificar más caracteres (esto se denomina código ASCII extendido). Este código asigna los valores del 0 al 255 (codificados en 8 bits, es decir, en 1 byte) para las mayúsculas, las minúsculas, los dígitos, las marcas de puntuación y otros símbolos (incluyendo los caracteres acentuados del código ISO-Latín 1). 

Nota: el código ASCII extendido no está estandarizado y varía de acuerdo a la plataforma en que se utiliza. 

Los dos grupos de caracteres más comunes del código ASCII extendido son el código extendido ASCII OEM (integrado en el primer PC de IBM) y el código extendido ASCII ANSI (utilizado por los sistemas operativos actuales). 


El código extendido ASCII OEM: 



El código extendido ASCII ANSI: 

EBCDIC:
El código EBCDIC (en castellano, código de intercambio decimal binario extendido), desarrollado por IBM, se utiliza para codificar caracteres con 8 bits. A pesar de que IBM lo utiliza en muchos de sus equipos, no ha tenido tanto éxito como ASCII.

Unicode:

Unicode es un sistema de codificación de caracteres de 16 bits desarrollado en 1991. Unicode puede representar cualquier caracter a través de un código de 16 bits, independientemente del sistema operativo o el idioma de programación utilizado. Incluye casi todos los alfabetos actuales (como el árabe, el armenio, el cirílico, el griego, el hebreo y el latín) y es compatible con el código ASCII.

Comentarios

Entradas populares de este blog

TIPOS DE CONECTORES RJ

MEDIDAS DE ALMACENAMIENTO DE INFORMACIÓN Y CLASIFICACIÓN DE LAS DIRECCIONES IP