РЛ 1-2 кодир инф 2015.ppt
- Количество слайдов: 90
Специальность Правовое обеспечение национальной безопасности (030901. 65 ) Дисциплина Информатика и информационные технологии в профессиональной деятельности. Материалы презентации рассмотрены и одобрены на заседании ПМС кафедры Ми. И (протокол № 5 от 02. 14 г. ) Профессор кафедры Домбровская Л. А.
Лекция 1/2. Вычислительные основы информационных технологий Тема 1. Основы профессиональных информационных технологий. Вычислительные основы информационных технологий
Учебные вопросы: 1. Представление информации в ЭВМ. 2. Системы счисления как способ кодирования числовой информации. 3. Кодирование информации в ЭВМ. 4. Измерение информации.
1. Представление информации в ЭВМ.
• Отличительная черта современной информации и информации будущего — ее цифровая форма. • Электронную информацию можно хранить вечно — или столько, сколько нужно — в компьютерных базах данных. • Фотографии, фильмы и видеозаписи преобразуются в цифровую информацию. С каждым годом совершенствуются методы сбора информации и превращения ее в квадрильоны крошечных пакетов данных. Как только цифровая информация помещается в то или иное «хранилище» , любой, у кого есть персональный компьютер и средства доступа к базам данных, может «мгновенно» обратиться к ней и использовать ее по своему усмотрению. • Каким же образом информация представлена в компьютере?
1. 1. Дискретный и аналоговый вид информации • Если множество состояний носителя информации конечно или счетное (состояниям можно сопоставить натуральные числа), соответствующая информация называется дискретной или цифровой. Если какое то состояние определяется бесконечным непрерывным множеством значений, информация называется аналоговой. • Например, на выходе устройства возможны два состояния: подается или не подается напряжение, в таком случае состояниям можно сопоставить цифры 1 и 0, и информация дискретная. Если на выходе может быть любое напряжение в некотором диапазоне, информация аналоговая. • Одну и ту же информацию можно отразить в разных видах. Например, время может отражаться на часах в цифровом виде, а может в аналоговом – времени будет соответствовать угол поворота стрелок.
1. 2. Аналоговые и цифровые компьютеры • Компьютер (в переводе с англ. – вычислитель) – устройство или система, способная выполнять определенную последовательность операций, которая описывается программой. • Частным случаем компьютера является электронная вычислительная машина (ЭВМ), использующая электронные компоненты в качестве функциональ ных узлов. Компьютер в общем случае может быть основан не только на электронных, но и на оптических, квантовых, механических, биологических и других явлениях.
• В аналоговых компьютерах, которые работают с непрерывными входными данными одной природы, происходит моделировние их непрерывными процессами другой природы – электрическими, механическими, оптическими, биологическими и т. д. • Цифровые компьютеры используют дискретное представление информации. Это представление отражает конечное или счетное число состояний объекта, которые могут отражаться в виде чисел. • Информация любого типа: символьная, графическая, звуковая, командная для представления на электронных носителях кодируется на основании алфавита, состоящего только из двух символов (0, 1). Информация представленная в аналоговом виде, для того, чтобы быть сохраненной в электронной памяти, оцифровывается и приводится к двоичному коду.
• Каждая ячейка электронной памяти обладает информационной ёмкостью 1 бит. Физически, в зависимости от способа регистрации информации, это может быть конденсатор, находящийся в одном из двух состояний: разряжен (0), заряжен (1); элемент магнитного носителя: размагничен (0), намагничен (1); элемент поверхности оптического диска: нет лунки (0), есть лунка (1). • Одним из первых носителей информации, представленной в двоичном коде, была бумажная перфокарта, пробитое отверстие на которой означало 1, а цельная поверхность 0.
• Итак, любая информация в ПК должна быть преобразована в цифровой формат: • Числа – двоичная система счисления (8 я и 16 я); • Текст – каждой букве алфавита ставится в соответствие определенное число (вопрос 3 лекции) • Звуковая (аудио) информация – аналого цифровой преобразователь (АЦП) → запись на носитель → цифро аналоговый преобразователь (ЦАП) (воспроизведение звука). Виниловая пластинка – аналоговая звукозапись (спиральные канавки с бугорками), компакт диск – цифровая звукозапись (микроскопические впадинки (0 или 1) • Видео информация (самая объемная) – принцип тот же что и звук, но с процедурой сжатия. • Подробнее в теме 10 «Аудио и видео технологии в правоохранительной деятельности»
2. СИСТЕМЫ СЧИСЛЕНИЯ КАК СПОСОБ КОДИРОВАНИЯ ЧИСЛОВОЙ ИНФОРМАЦИИ
Код это набор условных сигналов для записи или передачи некоторых заранее определенных понятий
Одна и та же информация может быть представлена различными кодами, иначе говоря, в разных формах. Люди выработали множество форм представления информации. К ним относятся:
Разговорные языки (более 2000) Русский - КНИГА Английский Немецкий - BOOK BUCH Французский язык - LIVRE
Язык мимики и жестов
Научные языки (математики, физики, химии)
Языки искусства (музыка)
Языки искусства (живопись)
Языки искусства (скульптура)
Специальные языки (азбука Брайля)
Азбука Морзе A • − И • • P • − • Ш −−−− Б − • • • Й • −−− С • • • Щ −− • − В • −− К − • − Т − Ъ • −− • Г −− • Л • − • • У • • − Ь − • • − Д − • • М −− Ф • • − • Ы − • −− Е • H − • Х • • Э • • − • • Ж • • • − О −−− Ц − • Ю • • −− З −− • • П • −− • Ч −−− • Я • −
Морская семафорная азбука.
Ребус – это слово или фраза, закодированные с помощью комбинации фигур, букв и знаков. Попробуйте декодировать сообщение, т. е. разгадать следующий ребус. КОД ПИР ОГ В С А Н И Е
• Любой способ кодирования характеризуется наличием основы (алфавит, спектр цветности, система координат, основание системы счисления…) и правил конструирования информационных образов на этой основе.
2. 1. Кодирование чисел. Системы счисления Язык чи сел, как и лю бой друг ой, имеет св ой алфав ит. Система счисления — это способ записи чисел. ия я развит ва За врем ст ого обще ск человече о множество н азработа исления. р ч систем с Цифры – си мволы, при помощи кот орых записывает ся число. Системы счисления
Унарная система счисления простейшая и самая древняя 1 | 2 || 3 ||| 4 |||| 5 ||||| Для записи любых чисел используется всего один символ: палочка, узелок, зарубка, камешек. Этим кодом пользуются малыши, показывая на пальцах свой возраст. Системы счисления
Аддитивные системы счисления чтобы прочесть число, нужно сложить значения всех цифр add добавлять, складывать англ. Используется несколько цифр. Они могут изображаться так, как взбредет в голову, но разные цифры должны выглядеть по разному.
Нумерация индейцев Майя Сначала эта нумерация обслуживала пятеричную систему счисления, а потом ее приспособили для двадцатеричной.
счётом е простым щи чтобы сдаю и быть уверены в огл сего числа м ти показания. с справедливо итанции знаки е в кв потребимы У означают: рублей, а – тысяча звезд ублей, лесо – сто р ко блей, – десять ру квадрат ь, – один рубл Х еек, десять коп IIIII. десь I – копейку о сделать з жно был Дабы немо ений, их прибавл никак рчивать е знаки оче все таковы ями. мыми лини кругом пря В старину на Руси применялась система счисления, с помощью которой сборщики податей заполняли квитанции и делали записи в податной тетради. = 1 232 руб. 24 коп.
Алфавитные аддитивные системы счисления Славяне Римляне Сирийцы Евреи Греки Грузины Арабы Для записи чисел используется большая часть алфавита того народа, который использовал эту систему.
ГРУППЫ СИСТЕМ СЧИСЛЕНИЯ АНАТОМИЧЕСКОГО ПРОИСХОЖДЕНИЯ АЛФАВИТНЫЕ ПРОЧИЕ МАШИННЫЕ десятичная древнегреческая ионийская вавилонская двоичная пятеричная славянская глаголическая … восьмеричная двенадцатеричн ая славянская кириллическая двадцатеричная римская древнегрузинска я и … шестнадцатерична я
Система счисления (СС) способ кодирования числовой информации, т. е. способ записи чисел с помощью некоторого алфавита, символы которого называют цифрами. • Количество цифр, необходимых для записи числа в системе, называют основанием системы счисления. Основание системы записывается справа от числа в нижнем индексе: 510 , 1110102 , 2 F 316
КЛАССИФИКАЦИЯ СИСТЕМ СЧИСЛЕНИЯ Непозиционные – значение числа определяется как сумма или разность цифр числа Позиционные – величина, обозначаемая цифрой зависит от позиции цифры в числе
• Позиционные CC, когда значение каждой цифры числа определяется ее позицией в записи числа; • Непозиционные СС, когда значение цифры в числе не зависит от ее места в записи числа. • Примером непозиционной системы счисления является римская: числа IX, IV, XV и т. д. • Примером позиционной системы счисления является десятичная система, используемая повседневно.
Римская система счисления Цифры обозначаются буквами латинского алфавита. Меньшие цифры, поставленные справа от большего, прибавляются к его значению, а меньшая цифра, поставленная слева вычитается от большего. Сохранилась до наших дней. XXVIII = 10+10+10+5+1+1+1 = 28 MCMXXXV = ? I C / XXXIII = ? Эта система счисления неудобна для счета.
Десятичная система счисления • Десятичная система счисления – в настоящее время наиболее известная и используемая. • Изобретение десятичной системы счисления относится к главным достижениям человеческой мысли. Без нее вряд ли могла существовать, а тем более возникнуть современная техника. • Причина, по которой десятичная система счисления стала общепринятой, вовсе не математическая. Люди привыкли считать в десятичной системе счисления, потому что у них по 10 пальцев на руках. • Использует арабскую нумерацию, арабские цифры
Древнее изображение десятичных цифр не случайно: каждая цифра обозначает число по количеству углов в ней. Например, 0 углов нет, 1 один угол, 2 два угла и т. д. Написание десятичных цифр претерпело существенные изменения. Форма, которой мы пользуемся, установилась в XVI веке
• Десятичная система впервые появилась в Индии примерно в VI веке новой эры. Индийская нумерация использовала девять числовых символов и нуль для обозначения пустой позиции. В ранних индийских рукописях, дошедших до нас, числа записывались в обратном порядке наиболее значимая цифра ставилась справа. Но вскоре стало правилом располагать такую цифру с левой стороны. • Особое значение придавалось нулевому символу, который вводился для позиционной системы обозначений. • Индийская нумерация, включая нуль, дошла и до нашего времени. • В Европе индусские приёмы десятичной арифметики получили распространение в начале ХIII в. благодаря работам итальянского математика Леонардо Пизанского (Фибоначчи). • Европейцы заимствовали индийскую систему счисления у арабов, назвав ее арабской. Это исторически неправильное название удерживается и поныне.
• Десятичная система использует десять цифр – 0, 1, 2, 3, 4, 5, 6, 7, 8 и 9, а также символы “+” и “–” для обозначения знака числа и запятую или точку для разделения целой и дробной частей числа.
• Любое целое число в позиционной системе можно записать в виде многочлена: • где S основание системы счисления; • An цифры числа, записанного в данной системе счисления • n количество разрядов числа
Пример • Число 629310 запишется в форме многочлена следующим образом: • 629310 = 6*103 +2*102 +9*101 +3*100
• В вычислительных машинах используется двоичная система счисления, её основание число 2. Для записи чисел в этой системе используют только две цифры 0 и 1. • Двоичная система счисления была придумана не инженерами конструкторами ЭВМ, а математиками и философами задолго до появления компьютеров, еще в ХVII ХIХ веках. • В 1703 г. немецкий математик Г. В. Лейбниц рекомендовал ее для теоретических исследований, добавил операции над числами. • Широко применяется с момента создания ЭВМ.
• Выбор двоичной системы для применения в вычислительной технике объясняется тем, что электронные элементы триггеры, из которых состоят микросхемы ЭВМ, могут находиться только в двух рабочих состояниях.
• Двоичная система удобна для компьютера, но неудобна для человека: числа получаются длинными и их трудно записывать и запоминать. Конечно, можно перевести число в десятичную систему и записывать в таком виде, а потом, когда понадобится перевести обратно, но все эти переводы трудоёмки. • Поэтому применяются системы счисления, родственные двоичной восьмеричная и шестнадцатеричная. Для записи чисел в этих системах требуется соответственно 8 и 16 цифр. В 16 теричной первые 10 цифр общие, а дальше используют заглавные латинские буквы. Шестнадцатеричная цифра A соответствует десятеричному числу 10, шестнадцатеричная B – десятичному числу 11 и т. д. • Использование этих систем объясняется тем, что переход к записи числа в любой из этих систем от его двоичной записи очень прост.
Основание системы счисления - это количество цифр в алфавите системы счисления. 0, 1 – двоичная (2) 0, 1, 2 – троичная (3) 0, 1, 2, 3, 4 – пятеричная (5) 0, 1, 2, 3, 4, 5, 6, 7 – восьмеричная (8) 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 – десятичная (10) 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F – шестнадцатеричная (16) …
Машинные системы счисления Алфавиты СС: • • • 10 я: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 2 я: 0, 1 8 я: 0, 1, 2, 3, 4, 5, 6, 7 16 я: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F Рассмотрим формирование таблицы соответствия чисел, записанных в разных системах:
Правила записи Десятичная Двоичная 0 Восьмеричная 0 Шестнадцатиричная 0 0
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B 12 1100 14 C
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B 12 1100 14 C 13 1101 15 D
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110 16 E
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110 16 E 15 1111 17 F
Правила записи Десятичная Двоичная Восьмеричная Шестнадцатиричная 0 0 1 1 2 10 2 2 3 11 3 3 4 100 4 4 5 101 5 5 6 110 6 6 7 111 7 7 8 1000 10 8 9 1001 11 9 10 1010 12 А 11 1011 13 B 12 1100 14 C 13 1101 15 D 14 1110 16 E 15 1111 17 F 16 10000 20 10
Арифметические действия в двоичной системе счисления Сложение в двоичной системе счисления 0 + 0 = 0; 1 + 0 = 1; 0 + 1 = 1; 1 + 1 = 10
Арифметические действия в двоичной системе счисления Вычитание в двоичной системе счисления 0 – 0 = 0; 1 – 0 = 1; 1 – 1 = 0; 10 – 1 = 1.
2. 2 Перевод целых чисел из системы счисления с основанием S в десятичную систему счисления • Число, записанное в позиционной системе счисления с любым основанием, переводится в десятичную систему счисления по указанному выше правилу с использованием многочлена: • 458=4*81+5*8 0=4*8+5*1=32+5=3710 • 2035=2*52+0*51+3*50=2*25+0*5+3*1=50+0+3=5310 • Меняется только основание системы счисления, алгоритм остается неизменным. • Чтобы легче осуществлять перевод из системы счисления по любому основанию в десятичную, следует для начала явно пронумеровать разряды исходного числа справа налево, начиная с 0
Перевод числа из двоичной системы в десятичную 2 → 10 • 11012=1*2 3+1*2 2+0*2 1+1*2 0=1*8+1*4+0*2+1*1=1310 • 111010002 = 27 + 26 + 25 + 23 = 128 + 64 + 32 + 8 = 23210
Перевод целых чисел из двоичной системы счисления в десятичную 1 1 1 0 0 1 5 4 3 2 1 0 1110012 = 1*25 + 1*24 + 1*23 + 0*22 + 0*21 + 1*20 = 32 + 16 + 8 + 1 = 5710
• Аналогично переводят восьмеричное и шестнадцатеричное число в десятичное:
2. 3. Перевод целых чисел из десятичной системы счисления в системы счисления с другим основанием. • 10 → 2 (2210 = 101102 ) • 10 → 8 (57110 = 10738 ) 10 → 16
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 0 1 2 3 4 5 6 7 8 9 A B C D E F 000 0 001 1 010 2 011 3 100 4 101 5 110 6 111 7 В компьютере вся информация представлена в виде длинных последовательностей 0 и 1 – двоичных чисел. Эти последовательности неудобны для восприятия. Поэтому двоичные числа разбивают на группы по три или четыре разряда. 23 = 8 24 = 16 Из трёх 0 и 1 можно составить восемь различных двоичных чисел, а из четырёх – шестнадцать.
Перевод целых чисел из двоичной системы счисления в восьмеричную Разделяем двоичное число на триады (по три символа) от десятичной запятой. 000 0 001 1 010 2 011 3 100 4 101 5 110 6 111 7 11001010112 14538 1= 4 5 3 По таблице смотрим соответствие цифр двоичной и восьмеричной систем счисления.
Перевод чисел из двоичной системы счисления в шестнадцатеричную Разделяем двоичное число на тетрады (по четыре символа) от десятичной запятой. 11001010112 32 B 16 3= 2 B По таблице смотрим соответствие цифр двоичной и шестнадцатеричной систем счисления. 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 0 1 2 3 4 5 6 7 8 9 A B C D E F
3. Кодирование информации в ЭВМ
3. 1. Кодирование символов. Байт • На основании одной ячейки информационной ёмкостью 1 бит можно закодировать только 2 различных состояния. • Для того чтобы каждый символ, который можно ввести с клавиатуры в латинском регистре, получил свой уникальный двоичный код, требуется 7 бит. • На основании последовательности из 7 бит, в соответствии с формулой Хартли, может быть получено • N=27=128 различных комбинаций из нулей и единиц, • т. е. двоичных кодов. • Поставив в соответствие каждому символу его двоичный код, мы получим кодировочную таблицу. Человек оперирует символами, компьютер – их двоичными кодами.
Кодировочная таблица ASCII • Для латинской раскладки клавиатуры такая кодировочная таблица одна на весь мир, поэтому текст, набранный с использованием латинской раскладки, будет адекватно отображен на любом компьютере. Эта таблица носит название ASCII (American Standard Code of Information Interchange) по английски произносится [э ски], по русски произносится [а ски]. • Коды с 0 по 31 в этой таблице не задействованы.
Кодировочная таблица ASCII код символ код символ 32 Пробел 48 . 64 @ 80 P 96 ' 112 p 33 ! 49 0 65 A 81 Q 97 a 113 q 34 " 50 1 66 B 82 R 98 b 114 r 35 # 51 2 67 C 83 S 99 c 115 s 36 $ 52 3 68 D 84 T 100 d 116 t 37 % 53 4 69 E 85 U 101 e 117 u 38 & 54 5 70 F 86 V 102 f 118 v 39 ' 55 6 71 G 87 W 103 g 119 w 40 ( 56 7 72 H 88 X 104 h 120 x 41 ) 57 8 73 I 89 Y 105 i 121 y 42 * 58 9 74 J 90 Z 106 j 122 z 43 + 59 : 75 K 91 [ 107 k 123 { 44 , 60 ; 76 L 92 108 l 124 | 45 61 < 77 M 93 ] 109 m 125 } 46 . 62 > 78 N 94 ^ 110 n 126 ~ 47 / 63 ? 79 O 95 _ 111 o 127 DEL
• Чтобы хранить также и коды национальных символов каждой страны (в нашем случае – символов кириллицы) требуется добавить еще 1 бит, что увеличит количество уникальных комбинаций из нулей и единиц вдвое, т. е. в нашем распоряжении дополнительно появится 128 свободных кодов (со 128 го по 255 й), в соответствие которым можно поставить символы русского алфавита. • Таким образом, отведя под хранение информации о коде каждого символа 8 бит, мы получим N=28=256 уникальных двоичных кодов, что достаточно, чтобы закодировать все символы, которые можно ввести с клавиатуры.
Байт • Байт последовательность из 8 бит. • 1 байт = 23 бит = 8 бит. • На основании одного байта можно получить 28=256 уникальных двоичных кодов. • В современных кодировочных таблицах под хранение информации о коде каждого символа отводится 1 байт. • 1 символ = 1 байт. • В байтах измеряется объем данных (V) при их хранении и передаче по каналам связи. Например, текст “Добрый день!” занимает объем равный 12 байтам. • Биты в байте нумеруются с конца с 0 го по 7 й. Минимальная комбинация на основании одного байта – восемь нулей, максимальная – восемь единиц. 11112=27+26+25+24+23+22+21+20=128+64+32+16+8+4+2+1=25510
• При хранении на физическом уровне каждый байт может быть реализован, например, на базе восьми конденсаторов, каждый из которых либо разряжен (0), либо заряжен (1): • Байт: min и max комбинации Байт: эл. импульс и бит
Веса восьми двоичных цифр • 7 6 5 4 3 2 1 0 < позиция (№) бита • 7 6 5 4 3 2 1 1 1 128 64 32 16 8 4 2 1 < десятичное значение
Современные кодировочные таблицы Код Windows-1251 КОИ-8 ISO 192 А Ю Р 193 Б А С 194 В б Т 1 символ = 1 байт Под национальные кодировки отданы коды с 128 -го по 255 -й
• На каждом компьютере имеются все основные кодировочные таблицы, и если тест выглядит неадекватно, нужно попробовать перекодировать его, просто указав использовать другую кодировочную таблицу.
Unicode (Юникод) • 1 символ = 2 байта = 16 бит • N=216=65 536 символов – возможности кодирования • Юникод включает практически все современные письменности, в том числе: арабскую, армянскую, бенгальскую, бирманскую, греческую, грузинскую, деванагари, иврит, кириллицу, коптскую, кхмерскую, латинскую, тамильскую, хангыль, хань (Китай, Япония, Корея), чероки, эфиопскую, японскую (катакана, хирагана, кандзи) и другие. • С академической целью добавлены многие исторические письменности, в том числе: древнегреческая, египетские иероглифы, клинопись, письменность майя, этрусский алфавит. • В Юникоде представлен широкий набор математических и музыкальных символов, а также пиктограмм. • Недостаток для хранения текста требуется вдвое больше дискового пространства, а для его передачи по каналам связи – вдвое больше времени.
UTF-8 (Unicode Transformation Format). • Для решения этой проблемы на практике больше распространено представление Юникода UTF-8 (Unicode Transformation Format). • UTF 8 обеспечивает наилучшую совместимость с системами, использующими 8 битные символы. Текст, состоящий только из символов с номером меньше 128, при записи в UTF 8 превращается в обычный текст ASCII. Остальные символы Юникода изображаются последовательностями длиной от 2 до 4 байтов. • В целом, так как самые распространенные в мире символы – символы латинского алфавита в UTF 8 по прежнему занимают 1 байт, такое кодирование экономичнее, чем чистый Юникод.
4. Измерение информации
• При хранении и передаче информации с помощью технических устройств информацию следует рассматривать как последовательность символов знаков (букв, цифр, кодов цветов точек изображения и т. д. ). • Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события). • Тогда, если считать, что появление символов в сообщении равновероятно, количество возможных событий N можно вычислить как N=2 i. • Количество информации в сообщении I можно подсчитать, умножив количество символов K на информационный вес одного символа i.
Имеются формулы, необходимые для определения количества информации в алфавитном подходе: N=2 i i Информационный вес символа, бит N Мощность алфавита I=K*i K Количество символов в тексте I Информационный объем текста
Возможны следующие сочетания известных (Дано) и искомых (Найти) величин: Тип 1 Дано i Найти Формула N N=2 i 2 N i 3 i, K I 4 i, I K 5 I, K i 6 N, K I 7 N, I K 8 I, K N I=K*i Обе формулы
• • • • • Задача 1. Один символ алфавита «весит» 4 бита. Сколько символов в этом алфавите? Решение: Дано: i=4. Найти: N ? По формуле N=2 i находим N=24, N=16 Ответ: 16 Задача 2. Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите? Решение: Дано: i=8. Найти: N ? По формуле N=2 i находим N=28, N=256 Ответ: 256 Задача 3. Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита? Решение: Дано: N=32. Найти: i ? По формуле N=2 i находим 32=2 i, 25=2 i, i=5 Ответ: 5
РЛ 1-2 кодир инф 2015.ppt