2. Кодовая таблица.pptx
- Количество слайдов: 35
• Лекция № 5 Кодовая таблица Основные понятия теории информации Представление информации Файловая система
Кодовая таблица • Кодовая таблица — это внутреннее (закодированное) представление в машине букв, цифр, символов и управляющих сигналов. • Пример: латинская буква А в кодовой таблице представлена десятичным числом 65 D (внутри ЭВМ это число будет представлено двоичным числом 01000001 В) • Пример: кодируются цифры (например, 1 — 49 D, 2 — 59 D) и символы (например, ! — 33 D, + — 43 D) • Пример: закодированы управляющие сигналы; код 13 D заставляет печатающую головку принтера вернуться к началу текущей строки
Кодовая таблица • Кодовая таблица может быть представлена не только с помощью десятичной СС, но и при помощи шестнадцатеричной СС. • Внутри ЭВМ сигналы, представлены в двоичной системе счисления, а в кодовой таблице для большего удобства чтения пользователем — в десятичной или шестнадцатеричной СС. • Каждая буква, цифра, знак препинания или управляющий сигнал кодируются восьмиразрядным двоичным числом. • С помощью восьмиразрядного числа (однобайтового числа) можно представить (закодировать) 256 произвольных символов — букв, цифр и вообще графических образов. • В мире в качестве стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange — Американский стандарт кодов для обмена информацией).
ASCII (American Standard Code for Information Interchange • Американский стандарт кодов для обмена информацией (ASCII) регламентирует ровно половину возможных символов (латинские буквы, арабские цифры, знаки препинания, управляющие сигналы). Для их кодировки используются коды от 0 D до 127 D. • Вторая половина кодовой таблицы ASCII (с кодами от 128 до 255) не определена американским стандартом и предназначена для размещения символов национальных алфавитов других стран (в частности, кириллицы — русских букв), псевдографических символов, некоторых математических знаков. • В разных странах, на различных моделях ЭВМ, в разных операционных системах могут использоваться и разные варианты второй половины кодовой таблицы (их называют расширениями ASCII). Например, таблица, которая используется в операционной системе MS-DOS, называется CP 866.
Таблица кодов CP‑ 1251 • При работе в операционной системе Windows используется таблица кодов CP‑ 1251, в которой кодировка латинских букв совпадает с кодировкой таблиц CP-866 и ASCII, а вторая половина таблицы имеет собственную раскладку (кодировку) символов.
Недостаток однобайтовых кодовых таблиц • Внешне одинаковое слово внутри ЭВМ может быть представлено различным образом. Это вызывает определенные неудобства. При работе в Интернет национальный текст порой становится нечитаемым. Наиболее вероятной причиной в этом случае является несовпадение кодировок второй половины кодовых таблиц. • Если для составления писем, отправляемых по электронной почте, используется первая половина кодовой таблицы (латиница), то проблемы с кодировкой не возникают. • Общим недостатком всех однобайтовых кодовых таблиц (в них для кодировки используются восьмиразрядные двоичные числа) является отсутствие в коде символа какой-либо информации, которая подсказывает машине, какая в данном случае используется кодовая таблица.
Система кодировки символов Unicode • Сообществом фирм Unicode предложена в качестве стандарта другая система кодировки символов. В этой системе для представления (кодирования) одного символа используются два байта (16 битов), что позволяет включить в код символа информацию о том, какому языку принадлежит символ и как его нужно воспроизводить на экране монитора или на принтере. • • Два байта позволяют закодировать 65 536 символов. Правда, объем информации, занимаемой одним и тем же текстом, увеличится вдвое. Зато тексты всегда будут «читаемыми» независимо от использованного национального языка и операционной системы.
Основные понятия теории информации
Основные понятия теории информации • Теория информации – раздел математики, исследующий процесс хранения, преобразования и передачи информации. • Согласно теории информации количество полученной информации следует рассматривать с учетом понятия неопределенности состояния системы, например, неопределенность состояния системы связи. Вместо термина «неопределенность состояния системы» часто используют эквивалентный термин - «энтропия системы» . • Под неопределенностью состояния системы связи понимается тот факт, что на приемной стороне получатель информации не знает, какое сообщение пошлет отправитель информации, который находится на передающей стороне системы связи. Лишь после приема сообщения (букв, цифр символов, звуков, изображения и т. д. ) у получателя уменьшается неосведомленность относительно содержания передаваемого сообщения. Иначе говорят: полученная информация уменьшает энтропию системы.
Основные понятия теории информации • Сообщение – это совокупность знаков или первичных сигналов, отображающих ту или иную информацию. • Передача сообщений на расстояние осуществляется с помощью какого-либо материального носителя или физического процесса (звуковых, световых или электромагнитных волн и т. п. - энергии). • Физический процесс, несущий передаваемое сообщение, называется сигналом.
• Сообщения могут быть функциями времени (информация представляется в виде сигналов - музыка, речь, показания датчиков) и не являться функциями времени (информация представляется в виде совокупности знаков - телеграмма, письмо). • В современных системах связи чаще всего используются электрические и оптические сигналы. Передача информации осуществляется путем изменения какого-либо параметра сигнала в соответствии с передаваемым сообщением, например, путем изменения амплитуды, частоты, фазы гармонических колебаний или длительности прямоугольных импульсов.
Модуляция - демодуляция • Процесс изменения параметров сигнала на передающей стороне, происходящий в соответствии с содержанием передаваемого сообщения, называется модуляцией. Благодаря модуляции сигнал получает возможность распространяться на большие расстояния с помощью системы связи. • Процесс восстановления сообщения из принятого сигнала называется демодуляцией (или детектированием).
Виды модуляции В качестве сигнала, несущего информацию, могут быть использованы синусоидальные гармонические колебания, последовательность прямоугольных импульсов. Информативным параметром может быть амплитуда колебаний (размах по вертикали), или частота – плотность колебаний по горизонтали. Таким образом, можно передать по аналоговому каналу, например, цифровые сигналы 1 и 0.
Виды модуляции • Если в качестве сигналов, переносящих информацию, используются прямоугольные импульсы, то в этом случае при модуляции могут изменяться длительность импульсов, их временное положение , частота.
Линии и системы связи • Линией связи называется физическая среда, используемая для транспортировки сигналов от передатчика к приемнику. • В качестве примера линии связи можно назвать оптоволоконный и коаксиальный кабели связи, пространство, в котором распространяются радиоволны. • Совокупность технических средств, предназначенных для передачи сообщений от отправителя к получателю, называется системой связи. В качестве составных частей в систему связи входят передающее устройство (передатчик), канал связи и приемное устройство (приемник).
Отправители и получатели информации • Отправителями и получателями информации могут быть • субъекты (пользователи, абоненты, корреспонденты) и • объекты (датчики, компьютеры, факсмодемы, принтеры, устройства автоматики и т. п. ).
Каналы связи • Каналом связи называют часть системы связи, которая обеспечивает передачу сигналов между передатчиком и приемником информации. • • В состав канала связи входят линии связи и каналообразующая аппаратура (КА). Задачей каналообразующей аппаратуры является уплотнение сигналов, то есть передача по одной физической линии информации сразу от нескольких отправителей. • Существуют каналы проводной связи (проводные, кабельные, световодные и др. ) и каналы радиосвязи (телевизионные, радио - и сотовые станции). • Широкое распространение получили радиорелейные линии (РРЛ).
Радиорелейные линии • В радиорелейных линиях радиосигнал передается от одной станции к другой (ретранслируется) как бы по эстафете в пределах прямой видимости. • Разновидностью РРЛ являются тропосферные линии, которые используют отражения радиосигнала от неоднородностей тропосферы. • Существуют спутниковые сети - радиорелейные линии, в которых ретранслятор располагается на искусственном спутнике земли.
Представление информации
Две формы представления информации • Различают две формы представления информации — непрерывную (аналоговую) и прерывистую (цифровую, дискретную). • Непрерывная форма характеризует процесс, который не имеет перерывов и теоретически может изменяться в любой момент времени и на любую величину (например, речь человека, музыкальное произведение). • • Цифровой сигнал может изменяться лишь в определенные моменты времени и принимать лишь заранее обусловленные значения (например, только значения напряжений 0 и 3, 5 В). Моменты возможного изменения уровня цифрового сигнала задает тактовый генератор конкретного цифрового устройства.
Дискретизация • Для преобразования аналогового сигнала в цифровой сигнал требуется провести: • дискретизацию непрерывного сигнала во времени, • квантование по уровню, • а затем кодирование отобранных значений. • Дискретизация — замена непрерывного (аналогового) сигнала последовательностью отдельных во времени отсчетов этого сигнала. Наиболее распространена равномерная дискретизация.
Преобразование аналогового сигнала в цифровой сигнал Цифровой сигнал в данном случае может принимать пять различных уровней. Естественно, что качество такого преобразования невысокое. Измерение цифрового сигнала возможно лишь в некоторые моменты времени (в данном случае этих моментов одиннадцать) Непрерывный сигнал Показанный на рисунке непрерывный сигнал заменяется представляют числами 2 -3 -4 -4 -4 -3 -2 -2 -3 -4 -4. Затем перечисленные десятичные последовательностью числа (кодируют) в последовательность единиц и нулей. чисел.
Дискретизация • В данном случае цифровые сигналы представлены четырьмя разрядами двоичных чисел. • Очевидно, что, чем больше разрядов у двоичных чисел (а значит, тем больше число уровней квантования) и чем чаще во времени осуществляются отсчеты (выборки), тем точнее будет преобразован непрерывный сигнал в цифровой.
Цифровая аудиозапись Пример При аналоговой аудиозаписи непрерывный электрический сигнал, формируемый источником звука на выходе микрофона, с помощью магнитной головки наносится на движущуюся магнитную ленту. Недостатком аналогового способа обработки информации является то, что копия бывает всегда хуже оригинала. При цифровой аудиозаписи используется процесс выборки, заключающийся в периодическом измерении уровня (громкости) аналогового звукового сигнала, поступающего с выхода микрофона) и превращении полученного значения в последовательность двоичных чисел. Для преобразования аналогового сигнала в цифровой используется специальный конвертор, называемый аналогово-цифровой преобразователь (АЦП). Сигнал на выходе АЦП представляет собой последовательность двоичных чисел, которая может быть записана на лазерный диск или обработана компьютером. Обратная конверсия цифрового сигнала в непрерывный сигнал осуществляется с помощью цифроаналогового преобразователя (ЦАП).
О качестве АЦП • Качество аналогово-цифрового преобразования характеризует параметр, называемый разрешением. • Разрешение — это количество уровней квантования, используемых для замены непрерывного аналогового сигнала цифровым сигналом. Восьмиразрядная выборка позволяет получить только 256 различных уровней квантования цифрового сигнала, а шестнадцатиразрядная выборка — 65 536 уровней. • Другой показатель качества трансформации непрерывного сигнала в цифровой сигнал —частота дискретизации — количество преобразований аналог-цифра (выборок), производимое устройством в одну секунду. Этот показатель измеряют килогерцами (килогерц — тысяча выборок в секунду). Типичное значение частоты дискретизации современных лазерных аудиодисков — 44, 1 к. Гц.
Файловая система
Диски ЭВМ, как правило, имеет несколько дисков. Каждому диску присваивается имя, которое задается латинской буквой с двоеточием, например, А: , В: , С: и т. д. Стандартно принято, что А: и В: — это накопители на гибких магнитных дисках, а диски C: , D: и т. д. — жесткие диски, накопители на оптических дисках или электронные диски. Электронные диски представляют собой часть оперативной памяти, которая для пользователя выглядит как ВЗУ. Скорость обмена информации с электронным диском значительно выше, чем с электромеханическим внешним запоминающим устройством. При работе электронных дисков не происходит износ электромеханических деталей. Однако после выключения питания информация на электронном диске не сохраняется.
Опять диски • Физически существующие магнитные диски могут быть разбиты на несколько логических дисков, которые для пользователя будут выглядеть на экране так же, как и физически существующие диски. При этом логические диски получают имена по тем же правилам, что и физически существующие диски. • Логический диск — это часть обычного жесткого диска, имеющая собственное имя. • Диск, на котором записана операционная система, называется системным (или загрузочным) диском. В качестве загрузочного диска чаще всего используется жесткий диск С: . • При лечении вирусов, системных сбоях загрузка операционной системы часто осуществляется с гибкого диска. Выпускаются оптические диски, которые также могут быть загрузочными. • В операционных системах DOS и Windows каждому диску можно дополнительно давать имена (label — метка), которые отражают их содержание, например: Системный, Графика, Музыка, Тексты, Дистрибутивы и т. д.
Форматирование Для того чтобы на новый магнитный диск можно было записать информацию, он должен быть предварительно отформатирован. Форматирование — это подготовка диска для записи информации. Во время форматирования на диск записывается служебная информация (делается разметка), которая затем используется для записи и чтения информации, коррекции скорости вращения диска. Разметка производится с помощью электромагнитного поля, создаваемого записывающей головкой дисковода. Запись информации осуществляется по дорожкам, причем каждая дорожка разбивается на секторы
Три части системной области • В процессе форматирования на диске выделяется системная область, которая состоит из трех частей: • загрузочного сектора, • таблицы размещения файлов • и корневого каталога. • Загрузочный сектор (Boot Record) размещается на каждом диске в логическом секторе с номером 0. Он содержит данные о формате диска, а также короткую программу, используемую в процедуре начальной загрузки операционной системы. • Загрузочный сектор создается во время форматирования диска. Если диск подготовлен как системный (загрузочный), то загрузочный сектор содержит программу загрузки операционной системы. В противном случае он содержит программу, которая при попытке загрузки с этого диска операционной системы выводит сообщение о том, что данный диск не является системным.
Три части системной области • Таблица размещения файлов (File Allocation Table — сокращенно FAT) располагается после загрузочного сектора и содержит описание порядка расположения всех файлов в секторах данного диска, а также информацию о дефектных участках диска. • За FAT-таблицей следует ее точная копия, что повышает надежность сохранения этой очень важной таблицы.
Три части системной области • Корневой каталог (Root Directory) всегда находится за копией FAT. • В корневом каталоге содержится перечень файлов и директорий, находящихся на диске.
Цилиндр • Для жесткого диска характерно еще одно понятие: цилиндр. • Цилиндром винчестера называется совокупность дорожек с одинаковыми порядковыми номерами, расположенных на разных дисках винчестера. На рисунке видны два цилиндра, образованные равноудаленными дорожками на трех дисках винчестера. При работе винчестера несколько головок одновременно считывают информацию с дорожек одного цилиндра.
Запись информации на диск кластер, состоящий из двух секторов • Запись информации на диск ведется частями. • Наименьшее место, которое могут занимать на диске записываемые данные, составляет один кластер. Кластер может состоять из одного или нескольких секторов. • Данные и программы хранятся на носителях информации в виде файлов (от англ. file — досье, подшивка). Файл — это набор взаимосвязанных данных, воспринимаемых компьютером как единое целое, имеющих общее имя, находящихся на магнитном или оптическом дисках, магнитной ленте, в оперативной памяти или на другом носителе информации. Файл обычно отождествляют с участком памяти (ВЗУ, ОЗУ, ПЗУ), где размещены логически связанные данные, имеющие общее имя. Файл хранится на носителе информации в двоичной системе счисления, и для ОС он представляется как совокупность связанных байтов.
второй файл Кластеры и файлы первый файл • На рисунке показаны два файла, расположенные последовательно друг за другом. Первый файл занимает два сектора, а второй файл — десять секторов. Если кластер состоит из двух секторов, то можно сказать, что первый файл состоит из одного кластера, а второй файл — из пяти кластеров. • Второй файл располагается на двух дорожках. Если файл большой, то он может занимать несколько дорожек. При записи информации на новый (чистый) диск файлы располагаются последовательно друг за другом: от первой дорожки до последней. Файлы всегда занимают целое число кластеров, поэтому в одном кластере не могут одновременно размещаться два даже небольших файла. Обратите внимание на то, что если документ состоит всего из одной буквы, то файл все равно занимает на диске один отдельный кластер.
2. Кодовая таблица.pptx