Все статьи
Принцип кодирования информации
Каждый современный человек знает, что любой компьютер, в том числе и новейшие мобильные сенсорные устройства, воспринимают всю информацию только в двоичном коде. Что такое двоичный код и как компьютер переводит всю информацию в 0 и 1 – расскажем в этой статье.
Кодирование информации
В действительности каждый из нас когда-то, так или иначе, кодировал информацию. Ведь даже язык математики, содержащий в себе цифры, иксы и игреки – это тоже кодирование. Ещё один пример кодирования информации – нотная грамота. Своеобразной формой кодирования информации для водителей являются знаки дорожного движения. Телеграфный код, представляющий собой азбуку Морзе, – яркий тому пример, причем международный. Таким образом, кодирование – это представление информации в виде каких-нибудь знаков (обозначений) или сигналов.
Почему именно двоичный код
Основная причина в том, что компьютеры – электронные устройства. Если вспомнить первые компьютеры, ламповые, то если в сети есть электрический сигнал, то лампочка горит, при отсутствии тока – не горит. Таким образом, возможны два состояния: «Да» или «Нет». Разработчики компьютеров придумали обозначать единицей (1) наличие сигнала (Да), а нулём (0) его отсутствие (Нет). Отсюда и пошло название – бит (bit – binary digit – двоичная цифра). Такой способ обозначения стал называться двоичным кодированием, то есть для составления кода используются только две цифры 0 и 1.
С тех пор все вся информации в электронном виде измеряется с помощью бита - наименьшей единицы. Но память компьютера невозможно измерить только битом. Трудно себе представить, сколько бит храни в себе компьютерная память. Каждый бит хранится в отдельной ячейке памяти. Восемь расположенных подряд ячеек с битами называют байтом. Байт воспринимается как единое целое – компьютерный символ, и является своеобразным адресом.
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
Таким образом, 1 байт = 8 бит.
Как закодировать текст
Байт – это уже символ, т.е. 1 байт = 1 символ. 11000000 – двоичный код заглавной русской буквы А. Английская буква А будет иметь другую последовательность двоичных цифр 01000001. Буквы различных алфавитов, знаки препинания, цифры, арифметические действия и другие всевозможные символы типа @ или &, пробел – каждый из этих символов имеет свой двоичный код.
А как узнать какой код какому символу соответствует? Существует специальная таблица кодировки, в которой двоичными кодами от 00000000 до 11111111 в определенном порядке размещены 256 символов. Но и тут не всё так просто, так как разработчики компьютеров и ПО создавали свои собственные отличные друг от друга кодировки. Получается, что в различных таблицах одна и та же русская буква имеет разный двоичный код (Windows-1251, KOI8-R, ISO, Mac, CP1251, ASCII). По этой причине порой мы не можем прочитать текст, полученный через Интернет, потому что на устройстве отправителя установлена другая таблица кодировки.
Как посчитать количество текстовой информации
Возьмём слово ВИДЕОФИЛЬМ. В этом слове 10 букв, следовательно, 10 символов. Итого это слово содержит 10 байт информации. В битах это будет 10 (байт) × 8 (бит) = 80 бит.
Если одна страница текста содержит 70 строк по 80 символов в каждой строке, то на такой странице 70×80=5600 символов, что равно 5600 байт, а, следовательно, 5600 байт. В одном килобайте 1024 байт, получается, что на странице приблизительно 5,5 Кб (5600:1024). На десяти таких страницах будет 55 килобайт информации.
Ваш комментарий
Рейтинги
Название | Рейтинг |
---|---|
1. СПбГУ | 221 |
2. СПбГАУ | 182 |
3. СПбГАСУ | 99 |
4. БГТУ | 64 |
5. РГПУ им. А. И. Герцена | 30 |
Название | Рейтинг |
---|---|
1. КАЛП | 28 |
2. КВТК | 28 |
3. ГУМРФ | 25 |
4. СПбТК | 21 |
5. Александровский лицей | 19 |
Название | Рейтинг |
---|---|
1. Брюсовская гимназия | 45 |
2. Лингва | 36 |
3. Земля и Вселенная | 22 |
4. Вторая Санкт-Петербургская гим | 12 |
5. Лицей №590 | 8 |
Комментарии