Все статьи

Принцип кодирования информации

Каждый современный человек знает, что любой компьютер, в том числе и новейшие мобильные сенсорные устройства, воспринимают всю информацию только в двоичном коде. Что такое двоичный код и как компьютер переводит всю информацию в 0 и 1 – расскажем в этой статье.

Кодирование информации

В действительности каждый из нас когда-то, так или иначе, кодировал информацию. Ведь даже язык математики, содержащий в себе цифры, иксы и игреки – это тоже кодирование. Ещё один пример кодирования информации – нотная грамота. Своеобразной формой кодирования информации для водителей являются знаки дорожного движения. Телеграфный код, представляющий собой азбуку Морзе, – яркий тому пример, причем международный. Таким образом, кодирование – это представление информации в виде каких-нибудь знаков (обозначений) или сигналов.

Почему именно двоичный код

Основная причина в том, что компьютеры – электронные устройства. Если вспомнить первые компьютеры, ламповые, то если в сети есть электрический сигнал, то лампочка горит, при отсутствии тока – не горит. Таким образом, возможны два состояния: «Да» или «Нет». Разработчики компьютеров придумали обозначать единицей (1) наличие сигнала (Да), а нулём (0) его отсутствие (Нет). Отсюда и пошло название – бит (bit – binary digit – двоичная цифра). Такой способ обозначения стал называться двоичным кодированием, то есть для составления кода используются только две цифры 0 и 1.

С тех пор все вся информации в электронном виде измеряется с помощью бита - наименьшей единицы. Но память компьютера невозможно измерить только битом. Трудно себе представить, сколько бит храни в себе компьютерная память. Каждый бит хранится в отдельной ячейке памяти. Восемь расположенных подряд ячеек с битами называют байтом. Байт воспринимается как единое целое – компьютерный символ, и является своеобразным адресом.

Таким образом, 1 байт = 8 бит.

Как закодировать текст

Байт – это уже символ, т.е. 1 байт = 1 символ. 11000000 – двоичный код заглавной русской буквы А. Английская буква А будет иметь другую последовательность двоичных цифр 01000001. Буквы различных алфавитов, знаки препинания, цифры, арифметические действия и другие всевозможные символы типа @ или &, пробел – каждый из этих символов имеет свой двоичный код.

А как узнать какой код какому символу соответствует? Существует специальная таблица кодировки, в которой двоичными кодами от 00000000 до 11111111 в определенном порядке размещены 256 символов. Но и тут не всё так просто, так как разработчики компьютеров и ПО создавали свои собственные отличные друг от друга кодировки. Получается, что в различных таблицах одна и та же русская буква имеет разный двоичный код (Windows-1251, KOI8-R, ISO, Mac, CP1251, ASCII). По этой причине порой мы не можем прочитать текст, полученный через Интернет, потому что на устройстве отправителя установлена другая таблица кодировки.

Как посчитать количество текстовой информации

Возьмём слово ВИДЕОФИЛЬМ. В этом слове 10 букв, следовательно, 10 символов. Итого это слово содержит 10 байт информации. В битах это будет 10 (байт) × 8 (бит) = 80 бит.

Если одна страница текста содержит 70 строк по 80 символов в каждой строке, то на такой странице 70×80=5600 символов, что равно 5600 байт, а, следовательно, 5600 байт. В одном килобайте 1024 байт, получается, что на странице приблизительно 5,5 Кб (5600:1024). На десяти таких страницах будет 55 килобайт информации.

" data-yashareType="button" data-yashareQuickServices="vkontakte,facebook,twitter,odnoklassniki">

Ваш комментарий

Рейтинги

Название	Рейтинг
1. СПбГУ	221
2. СПбГАУ	182
3. СПбГАСУ	99
4. БГТУ	64
5. РГПУ им. А. И. Герцена	30

Полный рейтинг

Название	Рейтинг
1. КАЛП	28
2. КВТК	28
3. ГУМРФ	25
4. СПбТК	21
5. Александровский лицей	19

Полный рейтинг

Название	Рейтинг
1. Брюсовская гимназия	45
2. Лингва	36
3. Земля и Вселенная	22
4. Вторая Санкт-Петербургская гим	12
5. Лицей №590	8