
random-121111020145-phpapp01.ppt
- Количество слайдов: 34
2/17/2018 Кодирование информации. Двоичное кодирование.
Кодирование информации Код – это система условных знаков для представления информации. Кодирование – это операция преобразования символов или группы символов одного кода в символы или группы символов другого кода. Кодирование – это запись информации с помощью некоторой знаковой системы (языка).
Кодирование информации ? Зачем кодируют информацию? кодирование данные (код) Информация передается, обрабатывается и хранится в виде кодов. 101010 передача борьба с помехами (специальные способы кодирования) данные (код) 11111100010 передача обработка хранение 3
Языки Язык – знаковая система, используемая для хранения и передачи информации (знаковая форма представления информации). Естественные языки: 1. носят национальный характер (русский, английский, …); 2. есть правила и исключения. Формальные языки: 1. интернациональны, понятны всем (язык физики и т. п. ); 2. наличие строгих правил. program qq; begin writeln("Привет!"); end. 4
Кодирование Упражнение 1. Закодируйте имя ВАСЯ с помощью азбуки Морзе. ВАСЯ ! Код неравномерный, нужен разделитель! 5
Кодирование Упражнение 2. Закодируйте имя ВАСЯ с помощью кодовой таблицы (Windows-1251): 0 1 2 3 4 5 6 7 8 9 A B C D E F C А Б В Г Д Е Ж З И Й К Л М Н О П D Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я ВАСЯ ! В А С Я С 2 С 0 D 1 DF Код равномерный, разделитель НЕ нужен! 6
Языки Грамматика – правила по которым из символов алфавита строятся слова. Синтаксис - правила по которым из слов. строятся предложения. Упражнение 3. Представьте с помощью естественных и нормальных языков следующую информацию Информация Нахождение площади треугольника Правило дорожного движения Призыв о помощи Формальный язык Естественный язык
Кодирование: цели и способы Текст: § в Росии: Привет, Вася! § Windows-1251: CFF 0 E 8 E 2 E 52 C 20 C 2 E 0 F 1 FF 21 § передача за рубеж (транслит): Privet, Vasya! § стенография: § шифрование: Рсйгжу-!Гбта” ? Числа: Как зашифровано? § для вычислений: 25 § прописью: двадцать пять § римская система: XXV ! Информация (смысл сообщения) может быть закодирована разными способами! 8
В процессе обмена информацией кроме кодирования информации происходит и ее декодирование: Источник информации Кодирующее устройство Декодирующее устройство Передача информации Получатель информации
Пример: как создается новая мелодия Образ мелодии Запись композитором мелодии нотами Перевод исполнителем нот в звуки Передача исполнителю носителя с нотами Прослушивание мелодии
Упражнение 4 (устно). Девочка заменила каждую букву своего имени ее номером в алфавите. Получилось 141261. Как зовут девочку? Код имени необходимо разделить следующим образом: 14 -1 -26 -1. 14 -М, 1 -А, 26 -Ш. Имя - Маша
Двоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1). Передача электрических сигналов: сигнал с помехами U U сигнал с помехами 5 В « 1» 1 полезный сигнал время полезный сигнал 0 1 « 0» время 12
Двоичное кодирование чис ла символы кодировщик рисунки 10101101110110101 звук • в такой форме можно закодировать все виды информации • нужны только устройства с двумя состояниями • практически нет ошибок при передаче • компьютеру легче обрабатывать данные • человеку сложно воспринимать двоичные коды ? Можно ли использовать не « 0» и « 1» , а другие символы, например, «А» и «Б» ? 13
Упражнение 4. Заполните таблицу: Количество бит Кодируемое количество сообщений 1 2 3 4 5 6 7 8 9 10
2/17/2018 Двоичное кодирование текстовой информации
При вводе в компьютер текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Традиционно для кодирования одного символа используется количество информации, равное 1 байту (8 битам). Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255, а каждому десятичному коду соответствует 8 разрядный двоичный код от 0000 до 1111. Код символа хранится в памяти компьютера, где занимает 1 байт. При таком способе можно закодировать 256 различных символов (256 = 28). Такое количество символов достаточно для представления текстовой информации, включая прописные и заглавные буквы русского алфавита, цифры, знаки, графические символы и т. д.
Кодирование символов Текстовый файл • на экране (символы) • в памяти – двоичные коды 10000012 10000102 10000112 10001002 65 ! 66 67 68 В файле хранятся не изображения символов, а их числовые коды в двоичной системе! А где же хранятся изображения? 18
Таким образом, компьютер различает символы по их коду. Присвоение символу конкретного кода является вопросом соглашения, которое фиксируется в конкретной кодовой таблице. В качестве международного стандарта принята кодовая таблица ASCII. В этой кодовой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.
Стандартными в этой таблице кодов ASCII являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 0000) до 127 (01111111). Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д. ). Коды 33 до 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (1111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов. В национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
Кодировка 1 байт на символ 0 127 1 таблица ASCII (международная) 128 254 255 кодовая страница ASCII = American Standard Code for Information Interchange 0 -31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc. 32 пробел знаки препинания: . , : ; ! ? специальные знаки: + - * / () {} [] 48 -57 цифры 0. . 9 65 -90 заглавные латинские буквы A-Z 97 -122 строчные латинские буквы a-z Кодовая страница (расширенная таблица ASCII) для русского языка: CP-866 для системы MS DOS CP-1251 для системы Windows (Интернет) КОИ 8 -R для системы UNIX (Интернет) 22
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 ( «Код обмена информационный – 8 битный» ). Эта кодировка применяется в компьютерах с операционной системой UNIX.
Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP 1251 ( «CP» означает «Code Page» ). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.
Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.
Стандарты кодировок: 1. КОИ-8 - UNIX 2. CP 1251 ( «CP» означает «Code Page» ) Microsoft Windows 3. CP 866 - MS-DOS 4. Mac - Macintosh 5. ISO 8859 – 5
Таблица кодировки символов Двоичный код Десятичный код 0000 КОИ 8 CP 1251 CP 866 Mac ISO 0 ……… 0000 1000 8 Удаление последнего символа (клавиша Backspace) 13 Перевод строки (клавиша Enter) 0010 0000 32 Пробел 0010 0001 33 ! 90 Z ……… 0000 1101 ……… 0101 1010 ……… 0111 127 ……… 128 - Ъ А А К 194 Б В - - Т 204 Л М : : Ь 221 Щ Э - Ё Н 225 Ь я Нераз. пробел п ……… 1100 0010 ……… 1100 ……… 1101 ……… 1111
В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows&Office 97.
Кодировка UNICODE (UTF-16) • Windows, MS Office, … • 16 бит на символ • 65536 или 216 символов в одной таблице можно одновременно использовать символы разных языков (Интернет) размер файла увеличивается в 2 раза 31
Задание : определите символ по числовому коду. • Запустите программу БЛОКНОТ • Нажмите ALT и 0224 (на дополнительной цифровой клавиатуре). • Появится символ а. • Повторите эту операцию для числовых кодов от 0225 до 0233. • Появятся символы в кодировке (CP 1251 Windows). • Запишите их в тетрадь.
Задание 2: определите символ по числовому коду. • Запустите программу БЛОКНОТ • Нажмите ALT и 161 (на дополнительной цифровой клавиатуре). • Появится символ. • Повторите эту операцию для числовых кодов 160, 169, 226. • Появятся символы в кодировке (CP 866 MSDOS). • Запишите их в тетрадь.
; II # $ % & I ( ) * + » - зз 34 35 36 3? 38 33 40 41 42 43 44 45 46 47 0 1 2 3 4 5 6 7 8 9 1 < = > 9 . 43 50 51 52 53 54 55 56 5? 58 59 60 61 62 63 ■ А В С D Е F G н 1 J К L M N 0 • i 65 66 67 68 63 Т 1 72 73 74 75 76 77 T 8 79 W X Y [ 3 - . / то р Q R S V т и z 84 85 86 81 88 89 90 91 92 33 94 35 е f Я h j i k 1 m n О 111 л ео 81 82 83 » а b С 96 зт 38 83 100 101 102 103 104 105 106 107 108 109 110 Р q Г S t U V W X У z { I } ~ 112 113 1 U 115 116 11 Т 118 113 120 121 122 123 124 125 126 а