Тремя цифрами можно закодировать 8 символов (2∙2∙2): 000, 001, 010, 011, 100, 101, 110, 111. Таким образом, увеличение количества цифр на единицу увеличивает количество закодированных символов в 2 раза.
В текстах, как правило, используется около 100 символов (заглавные и строчные буквы алфавита, цифры, знаки препинания, часто употребляемые математические символы и т.д.). Поэтому для кодирования такого текста необходимо как минимум 7 двоичных чисел - битов, с помощью которых можно представить 128 символов (2∙2∙2∙2∙2∙2∙2 = 128). В текстах на компьютере, помимо английского алфавита, используются и национальные алфавиты. В этом случае недостаточно последовательности из 7 бит. Требуется дополнительно еще один бит. Как было отмечено выше, добавление 1 бита дает возможность увеличить количество закодированных символов в два раза. То есть при помощи 8 бит можно закодировать 256 символов. Последовательность из 8 бит называют байтом.
Кодировка текстовой информации с помощью 8 бит называется ASCII стандартом (произносится как “аски”). ASCII стандарт состоит из двух таблиц кодировки: основной и расширенной. К основной таблице относятся коды от 0 до 127, к расширенной таблице – от 128 до 255. Коды букв национальных алфавитов (в том числе буквы “Ə”, “Ç”, “Ş”, “Ğ”, “Ü”, “Ö”, “İ” Азербайджанского алфавита) находятся в расширенной таблице.
ASCII-коды букв
английского алфавита
Символ | Двоичный код |
A | 01000001 |
B | 01000010 |
C | 01000011 |
D | 01000100 |
E | 01000101 |
F | 01000110 |
G | 01000111 |
H | 01001000 |
I | 01001001 |
J | 01001010 |
K | 01001011 |
L | 01001100 |
M | 01001101 |
Символ | Двоичный код |
N | 01001110 |
O | 01001111 |
P | 01010000 |
Q | 01010001 |
R | 01010010 |
S | 01010011 |
T | 01010100 |
U | 01010101 |
V | 01010110 |
W | 01010111 |
X | 01011000 |
Y | 01011001 |
Z | 01011010 |