Все об образовании Санкт-Петербурга: ВУЗы, институты, подготовительные курсы, школы, колледжи
Расширенный поиск
Свернуть

Все статьи

Принцип кодирования информации

Каждый современный человек знает, что любой компьютер, в том числе и новейшие мобильные сенсорные устройства, воспринимают всю информацию только в двоичном коде. Что такое двоичный код и как компьютер переводит всю информацию в 0 и 1 – расскажем в этой статье.

Кодирование информации

В действительности каждый из нас когда-то, так или иначе, кодировал информацию. Ведь даже язык математики, содержащий в себе цифры, иксы и игреки – это тоже кодирование. Ещё один пример кодирования  информации – нотная грамота. Своеобразной формой кодирования информации для водителей являются знаки дорожного движения. Телеграфный код, представляющий собой азбуку Морзе, – яркий тому пример, причем международный. Таким образом, кодирование – это представление информации в виде каких-нибудь  знаков (обозначений) или сигналов.

Почему именно двоичный код

Основная причина в том, что компьютеры – электронные устройства. Если вспомнить первые компьютеры, ламповые, то если в сети есть электрический сигнал, то лампочка горит, при отсутствии тока – не горит. Таким образом, возможны два состояния: «Да» или «Нет». Разработчики компьютеров придумали обозначать единицей (1) наличие сигнала (Да), а нулём (0) его отсутствие (Нет). Отсюда и пошло название – бит (bit – binary digit – двоичная цифра). Такой способ обозначения стал называться двоичным кодированием, то есть для составления кода используются только две цифры 0 и 1.

С тех пор все вся информации в электронном виде измеряется с помощью бита - наименьшей единицы. Но память компьютера невозможно измерить только битом. Трудно себе представить, сколько бит храни в себе компьютерная память. Каждый бит хранится в отдельной ячейке памяти. Восемь расположенных подряд ячеек с битами называют байтом. Байт воспринимается как единое целое – компьютерный символ, и является своеобразным адресом.

1

1

0

0

0

0

0

0

Таким образом, 1 байт = 8 бит.

Как закодировать текст

Байт – это уже символ, т.е. 1 байт = 1 символ. 11000000 – двоичный код заглавной русской буквы А. Английская буква А будет иметь другую последовательность двоичных цифр 01000001. Буквы различных алфавитов, знаки препинания, цифры, арифметические действия и другие всевозможные символы типа @ или &, пробел – каждый из этих символов имеет свой двоичный код.

А как узнать какой код какому символу соответствует? Существует специальная таблица кодировки, в которой двоичными кодами от 00000000 до 11111111 в определенном порядке размещены 256 символов. Но и тут не всё так просто, так как разработчики компьютеров и ПО создавали свои собственные отличные друг от друга кодировки. Получается, что в различных таблицах одна и та же русская буква имеет разный двоичный код (Windows-1251, KOI8-R, ISO, Mac, CP1251, ASCII). По этой причине порой мы не можем прочитать текст, полученный через Интернет, потому что на устройстве отправителя установлена другая таблица кодировки.

Как посчитать количество текстовой информации

Возьмём слово ВИДЕОФИЛЬМ. В этом слове 10 букв, следовательно, 10 символов. Итого это слово содержит 10 байт информации. В битах это будет 10 (байт) × 8 (бит) = 80 бит.

Если одна страница текста содержит 70 строк по 80 символов в каждой строке, то на такой странице 70×80=5600 символов, что равно 5600 байт, а, следовательно, 5600 байт. В одном килобайте 1024 байт, получается, что на странице приблизительно 5,5 Кб (5600:1024). На десяти таких страницах будет 55 килобайт информации.

Каждый современный человек знает, что любой компьютер, в том числе и новейшие мобильные сенсорные устройства, воспринимают всю информацию только в двоичном коде. Что такое двоичный код и как компьютер переводит всю информацию в 0 и 1 – расскажем в этой статье.

" data-yashareType="button" data-yashareQuickServices="vkontakte,facebook,twitter,odnoklassniki">

Ваш комментарий




Рейтинги