Алфавитный подход, который вам известен с младших классов, позволяет определять количество текстовой информации, состоящей из определенных символов алфавита. Познакомимся более подробно с ним. В технике обычно под информацией понимают любую последовательность символов в знаковой системе. Для определения количества такой информации, не принимая во внимание содержание, вычисляют длину этой последовательности (сообщения).
Как вы знаете, основой любого языка является набор специальных символов (знаков) - алфавит. Набор символов, используемый для представления информации в любом языке, называют алфавитом. Обычно в алфавит включают только буквы, но в информатике в него включают также цифры, знаки препинания, скобки, которые имеются в тексте наряду с буквами. В алфавит необходимо включить и символ пробела, то есть пропуск между словами.
Число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N.
Азербайджанский алфавит A B C Ç D E Ə |
Русский алфавит A Б B Г Д E Ж |
Двоичный алфавит 0 1 |
ASCII ! @ # $ % ^ & |
N = 32 | N = 33 | N = 2 | N = 256 |
Есть языки с очень интересными алфавитами. Один из них - китайский. В этом языке каждый иероглиф может выражать целое понятие, мысль. Новое слово, понятие представляется новым иероглифом. В китайском языке используют приблизительно 5000 иероглифов.
При алфавитном подходе считается, что каждый символ текста имеет оп- ределенный информационный вес. Информационный вес символа зависит от мощности алфавита. Как вы знаете, самый короткий алфавит имеет 2-ная система счисления, состоящая из двух символов: "0" и "1". Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит. Информационный вес символов других алфавитов определяется используемым для кодирования этих символов числом двоичных символов. Если информационный вес каждого символа алфавита обозначить буквой i, то для различных i можно составить следующую таблицу:
i | 1 бит | 2 битa | 3 битa | 4 битa | 5 бит | 6 бит | 7 бит | 8 бит |
N | 2 | 4 | 8 | 16 | 32 | 64 | 128 | 256 |