Лекция № 2 ПРЕДСТАВЛЕНИЕ ДАННЫХ НА ЭВМ o Общее представление данных и понятие о системах счисления o Структура данных. Единицы хранения данных
ОБЩЕЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ Для удобства последующего преобразования и для автоматизации работы с информацией сигнал подвергается кодированию. Прием кодирования – выражение данных одного типа через данные другого типа. Пример: алфавит, система координат, математические формулы … В зависимости от этого данные имеют внутреннее и внешнее представление
Коды Кодом называют правило, описывающее соответствие знаков одного набора знакам другого набора. Например: азбука Морзе А. – Б –… В. ––– Набор знаков зодиака (12 знаков)… Одну и ту же информацию можно закодировать по по разному: …__ __ __ … SOS сообщение о бедствии
ВНУТРЕННЕЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ Внутреннее представление данных определяется физическими принципами, по которым происходит обмен. Система кодирования в вычислительной технике называется двоичным кодированием. Любые данные для обработки в ЭВМ представляются последовательностями двух целых чисел — единицы и нуля. 1 и 0 Такая форма представления данных получила название двоичной.
СИСТЕМА СЧИСЛЕНИЯ Система счисления — это способ наименования и представления чисел с помощью символов, имеющих определенные количественные значения. В зависимости от способа представления чисел системы счисления делятся на непозиционные и позиционные. В непозиционных системах цифры не меняют своего количественного значения при изменении их расположения в числе. В позиционных системах количественное значение каждой цифры зависит от места (позиции) в числе.
Названия систем счисления Количество используемых символов определяет название системы счисления: v двоичная два (0 и 1); v восьмеричная восемь (0, 1, 2, 3, 4, 5, 6, 7); v десятичная десять (0 9); v шестнадцатеричная шестнадцать (0 9, A F). В общем случае в позиционной системе счисления с основанием s любое число x может быть представлено в виде полинома от основания s. Например, в де сятичной системе мы имеем число 123, 45 = 1 102+ 2 101+ 3 100+ 4 10 1+ 5 10 2 Записывая слева направо цифры числа, мы получим закодиро ванную запись числа s ичной системе счисления.
Представление символьной информации Правило представления символьной информации (букв алфавита и других символов) заключается в том, что каждому символу в компьютере ставится в соответствие дво ичный код — совокупность нулей и единиц. v 1 бит (0, 1) позволяет закодировать два символа v 2 бита (00, 01, 10, 11) — 4 символа, v 3 бита (000, 001, 010, 100, 011, 101, 110, 111) — 8 символов N битов — 2 n символов. Минимальное количе ство битов n, необходимое для кодирования Р символов, определяется из условия Р<2 n.
Система счисления Десятичная 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Двоичная 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 Система счисления Восьмеричная 0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 Шестиадцатеричная 0 1 2 3 4 5 6 7 8 9 А В С D Е F
Кодировка символов ASCII код (американский стандартный код для обме на информацией — англ. American Standart Code for Information Interchange) v v v Каждому символу поставлено в соответствие дво ичное число от 0 до 255 (8 битовый двоичный код) Например: А— 01000001, В — 01000010, С — 01000011, D — 0100 и т. д. Символы от 0 до 127 — латинские буквы, цифры и знаки препинания — составляют постоянную (базовую) часть таблицы. Расширенная таблица от 128 го до 255 го символа отводится под национальный стандарт. Та ким образом, каждый введенный в компьютер с клавиатуры символ запоминается и хранится на носителе в виде набора из восьми нулей и единиц.
Кодировка символов В настоящее время идет внедрение нового стандарта — Unicode. определяет кодировку каждого символа не одним байтом, а двумя. соответственно число одновременно кодируемых символов возрастает с 256 до 65 536. позволяет закодировать одновременно все известные символы, в том числе японские и китайские иероглифы. Существуют и национальные стандарты кодировки. Например, в СССР был введен стандарт КОИ-8 (код обмена информацией восьмизначный), который по сей день используется для кодировки текста.
Представление графических данных подходы к представлению (оцифровке) графических данных: v растровый v векторный q при растровом представлении вся область данных разбивается на множество точечных элементов — пикселей, каждый из которых имеет свой цвет. q совокупность пикселей называется растром, а изображения, которые формируются на основе растра, называются растровым. q число пикселей по горизонтали и вертикали изображения определяет разрешение изображения.
Представление графических данных при векторном представлении графических данных задается и впоследствии сохраняется математическое описание каждого графического примитива — геометрическо го объекта (отрезка, окружности, прямоугольника и т. п. ), из которых формируется изображение. Например, для воспроизведения окружности достаточно запомнить положение ее центра, радиус, толщину Благодаря этому для и цвет линии. хранения векторных графических данных требуется значительно меньше памяти.
Достоинства и недостатки представления графических данных Основным недостатком растровой графики является большой объем памяти. Это растровые объясняется тем, что запоминается цвет графические каждого пикселя, общее число которых редакторы задается разрешением, определяющим (Paint, Photo hop) s также качество представления графических данных. и векторные графические редакторы (Corel Draw, Visio). Основным недостатком векторной графики является невозможность работы с высококачественными художественными изображениями, фотографиями и фильмами, поэтому основной сферой применения векторной графики является представление в электронном виде чертежей, схем и т. п.
ВНЕШНЕЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ представлении (для пользователя) все данные хранятся в виде файлов. Файл — область памяти на внешнем носителе, Во внешнем которой присвоено имя. Простейшими способами внешнего представления данных являются: • вещественные и целые числа (числовые данные); • последовательность символов (текст); • изображение (графика, фотографии, рисунки, схемы).
ЕДИНИЦЫ ХРАНЕНИЯ ДАННЫХ Файл — это последовательность произвольного числа байтов данных, обладающая уникальным собственным именем. Имя файла состоит из двух разделенных точкой частей: собственного имени и расширения, определяющего тип файла. Например: Counterbalance. ехе Собственное имя файла может состоять из русских и английских букв, цифр и специальных символов. При этом его длина не должна превышать 256 символов. В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые. Исполняемые файлы — это такие файлы, которые могут выполняться самостоятельно, т. е. не требуют каких-либо специальных программ для их запуска.
Стандартные расширения имен исполняемых файлов Ø. ехе — готовый к исполнению файл (tetris. exe; winword. exe); Ø. com — файл (command. com); операционной системы Ø. bat — командный файл операционной системы MS-DOS (autoexec. bat).
НЕИСПОЛНЯЕМЫЕ ФАЙЛЫ Неисполняемые файлы для запуска требуют установки специальных программ. ▼Например, для того чтобы просмотреть текстовый документ, требуется наличие какого-либо текстового редактора. ü ü ü ü . pas — текст программы на Паскале; . bas — текст программы на Бейсике; . doc — текст, выполненный в редакторе Word; . mdb — файл СУБД Access; . xls — электронная таблица Excel; . arj — упакованный файл; . zip — упакованный файл; . txt — текст, выполненный в редакторе Блокнот.
ФАЙЛОВАЯ СТРУКТУРА Хранение файлов организуется в иерархической структуре, которая называется файловой структурой. На вершине структуры находится имя носителя, на котором сохраняются файлы и каталоги (папки). Далее следует корневой каталог, содержащий вложенные каталоги первого уровня, каждый из которых может содержать вложенные каталоги второго уровня и т. д.
ПОЛНОЕ ИМЯ ФАЙЛА Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. На одном носителе не может быть двух файлов с одинаковыми полными именами. Например: D: computer oldCalc 1
Спасибо за внимание