кодировка текста.ppt
- Количество слайдов: 20
Преставление информации в компьютере. Кодирование
Что такое информация? l Информация - сведения об объектах окружающего нас мира.
Язык как способ представления информации Естественные языки. Например, мы общаемся или переписываемся на русском или английском языке. l Формальные языки – языки, в которых заложены строгие однозначные правила и ограниченный словарь. - + H 2 O A l
Что такое кодирование информации? l l Кодирование информации – это процесс преобразования информации из одной формы в другую, более удобную для хранения, передачи и ее обработки. Например, перевод с одного языка на другой или шифровка и передача сигнала, азбука Морзе.
Как представлена информация в компьютере? Информация в компьютере представлена в виде двоичного кода, алфавит которого состоит из двух цифр: 0 и 1. 0 – отсутствие электрического сигнала; 1 – наличие электрического сигнала.
Код и декодирование Код – это совокупность условных знаков, каждому из которых присваивается определенное значение. Декодирование – процесс обратный кодированию. ВЫВОД: С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.
0 или 1 = 1 бит информации Вопрос: Вопрос Хватит ли 0 и 1, чтобы закодировать все символы, которые мы вводим в компьютер с клавиатуры?
Кодовая таблица Windows (ANSI, CP-1251)
ТАБЛИЦА КОДИРОВКИ Структура кодовой таблицы Кодировка в ОС Windows – код ANSI № Символ Двоичный код 0 NUL 0000 1 3 OH 00000001 … …. . …………… 31 US 00011111 … …. . …………… 82 R 01010010 83 S 01010011 84 T 01010100 … …. . …………… 127 01111111 … …. . …………… 195 Г 11000011 Кодовая страница CP-1251 196 Д 11000100 128 (10000000). . . 255 (1111) 197 Е 11000101 … …. . …………… 254 ю 11111110 Содержит русские буквы, упорядоченные в алфавитной последовательности (это правило соблюдается не во всех кодовых страницах) 255 я 1111 American National Standard Institute (американский институт стандартизации) Стандартная часть кода ANSI/ASCII 0 (0000). . . 127 (01111111) Символы с кодами 0 . . . 31 выполняют управляющие функции. При выводе текста они не отображаются графическими знаками.
Для кодировки текстовой информации одним из первых стандартов был код КОИ-8 (код обмена информацией 8 -битный) 256 = 8 2
Одному символу присваивается код из 8 двоичных разрядов М русская большая – 11101101 l М латинская большая – 01001101 l
Для 8 бит существует 256 8) комбинаций (2 от 0000 до 1111
Для каждой цифры, буквы, символа, а так же пробела существует своя комбинация из 8 бит. Каждый символ несет 8 бит информации
Единицы измерения количества информации 8 бит = 1 байт 1 Кбайт = 210 байт = 1024 байт 1 Мбайт = 210 Кбайт = 10242 байт = 1 048 576 байт 1 Гбайт = 210 Мбайт = 10243 байт 1 млрд. байт
Количество информации 1. 2. 3. 4. Все символы алфавита кодируются одинаковым числом бит. Чаще всего используются кодировки, в которых на символ отводится 8 бит (8 -битная кодировка) или 16 бит (16 -битная кодировка). После знака препинания внутри текста (не в его конце!) ставится пробел. Чему равен информационный объём текста? Информационный объём текста I равен произведению количества символов K на число бит i, приходящихся на один символ: I = i*K.
Физический объем информации это число символов в сообщении, содержащем информацию, умноженное на информационную емкость одного символа
Задание: Посчитайте количество бит и байт в следующих выражениях: Мир 3 байта = 24 бит Миру мир! 9 байт = 72 бит Vile, vide, vice 16 байт =128 бит
2 i =N ЗАДАЧИ I = i*K • Книга, набранная с помощью компьютера, содержит 150 страниц, на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге? Дано: N = 256 , значит 1 символ несет 8 бит или 1 байт информации 1). 60 * 40 = 2400 байт на одной странице 2). 2400 * 150 = 360 000 байт в книге 3). 360 000 : 1024 = 351, 5625 Кбайт 4). 351, 5625 : 1024 = 0, 34332275 Мбайт Ответ: 0, 34332275 Мбайт
2 i =N ЗАДАЧИ I = N*K • Для записи текста использовался 256 -символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста? Дано: N = 256 K = 30 * 70 * 5 1). N = 256 i = 8 2). I = K * i = 30 * 70 * 5 * 8 = 84 000 байт = 84 000 : 8 = 10 500 байт Ответ: 10 500 байта.


