Лекция_1- Информация и данные.ppt
- Количество слайдов: 20
ЛЕКЦИЯ 1 Информатика: предмет и задачи изучения дисциплины Понятие информации. Свойства информации. Информация и данные. Кодирование данных. Информационные процессы. Теоретическую основу информатики образует группа фундаментальных наук, которую в равной степени можно отнести как к математике, так и к кибернетике: теория информации, теория алгоритмов, математическая логика, теория формальных языков и грамматик, комбинаторный анализ и т. д. Кроме них информатика включает такие разделы, как архитектура ЭВМ, операционные системы, теория баз данных, технология программирования и многие другие. Информатика это научная область и прикладная область знаний, изучающая законы, методы и способы накопления, обработки и передачи информации с помощью компьютерных и других технических средств.
Ряд математических разделов опирающихся на математическую логику включает разделы : - теория алгоритмов и автоматов; - теория информации; - теория кодирования; - теория формальных языков и грамматик; - исследования операций. Т. е. используются мат методы для общего изучения процессов обработки информации. Вычислительная техника Изучается архитектура вычислительных систем, т. е. состав, назначение функциональные возможности, принципы взаимодействия устройств. Программирование Разработка систем многоуровнего программного обеспечения, существует пять уровней программного обеспечения: Базовый, содержащий программы начального тестирования и запуска компьютера; Системный, содержащий программы, реализующие всевозможные взаимодействия аппаратных, программных средств и человека; Служебный, содержащий программы вспомогательного назначения; Инструментальный, содержащий программы позволяющие создавать новые программы; Прикладной, содержащий программы пользователей. Информационные системы. Раздел изучающий вопросы анализа информационных потоков, их оптимизацию, структурирование и хранение данных поиск. Системы искусственного интеллекта. Моделирование рассуждений, компьютерная лингвистика (перевод), создание экспертных систем, распознавание образов и др. , важнейшее прикладное значение имеет создание интеллектуального интерфейса.
n n n Как известно, в материальном мире все физические объекты, ок ружающиенас, являются либо телами, либо полями. Физические объекты, взаимодействуя друг с другом, порождают сигналы различных типов. Любой сигнал — это изменяющийся во време нифизический процесс. Такой процесс может содержать различные характеристики. Характеристика, которая используется для представ ления данных, называется параметром сигнала. Если параметр сигна ла принимает ряд последовательных значений и их конечное число, то сигнал называется дискретным. Если параметр сигнала — непрерыв ная во времени функция, то сигнал называется непрерывным. В свою очередь, сигналы могут порождать в физических телах изменения свойств. Это явление называется регистрацией сигналов. Сигналы, зарегистрированные на материальном носителе, называют сяданными. Данные несут информацию о событии, но не являются самой информацией, так как одни и те же данные могут восприниматься (отображаться или еще говорят интерпретироваться) в сознании раз ных людей совершенно по-разному информация — это продукт взаимодействия данных адекватных методов. и МЕТОДЫ ДАННЫЕ ИНФОРМАЦИЯ
Момент слияния данных и методов называется информационным про цессом Рис. 1. Формирование информации Человек(лектор) звуковые волны (речь) тетрадь текст лекции информация лекции изучение Человек воспринимает первичные данные различными органами чувств (их у нас пять – зрение, слух, осязание, обоняние, вкус), и на их основе сознанием могут быть построены вторичные абстракт ные (смысловые, семантические) данные. Таким образом, первичная информация может существовать в виде рисунков, фотографий, звуковых, вкусовых ощущений, запахов, а вторичная – в виде чисел, символов, текстов, чертежей, радиоволн, магнитных записей.
n n n Свойства информации: Дуализм информации характеризует ее двойственность. С одной стороны, информация объективна в силу объективности данных, с другой — субъективна, в силу субъективности применяемых методов. Иными словами, методы могут вносить в большей или меньшей сте пени субъективный фактор и таким образом влиять на информацию в целом. Например, два человека читают одну и ту же книгу и полу чаютподчас весьма разную информацию, хотя прочитанный текст, т. е. данные, были одинаковы. Более объективная информация при меняет методы с меньшим субъективным элементом. Полнота информации характеризует степень достаточности дан ныхдля принятия решения или создания новых данных на основе имеющихся. Неполный набор данных оставляет большую долю неопределенности, т. е. большое число вариантов выбора, а это потребует применения дополнительных методов, например, экспертных оценок, бросание жребия и т. п. Избыточный набор данных затруд няет доступ к нужным данным, создает повышенный информацион ный шум, что также вызывает необходимость дополнительных мето дов, например, фильтрацию, сортировку. И неполный и избыточный наборы затрудняют получение информации и принятие адекватного решения. Достоверность информации – это свойство, характеризующее сте пеньсоответствия информации реальному объекту с необходимой точностью. При работе с неполным набором данных достоверность информации может характеризоваться вероятностью, например, мож носказать, что при бросании монеты с вероятностью 50 % выпадет «орел» . Адекватность информации выражает степень соответствия созда ваемогос помощью информации образа реальному объекту, процес су, явлению. Полная адекватность достигается редко, так как обыч но приходится работать с не самым полным набором данных, т. е. присутствует неопределенность, затрудняющая принятие адекватно го решения. Получение адекватной информации также затрудняется при недоступности адекватных методов. Доступность информации — это возможность получения инфор мации при необходимости. Доступность складывается из двух состав ляющих: из доступности данных и доступности методов. Отсутствие хотя бы одного дает неадекватную информацию. Актуальность информации. Информация существует во времени, так как существуют во времени все информационные процессы. Информация, актуальная сегодня, может стать совершенно ненуж ной по истечении некоторого времени. Например, программа теле передач на нынешнюю неделю будет неактуальна для многих теле зрителей на следующей неделе.
В самой науке – информатике – информацию рассматривают как продукт взаимодействия данных и методов их обработки, адекватных решаемой задаче. Наряду с этим термином будем употреблять и понятие данные. Данные – это представление информации в формализованном виде (формализовать – значит сделать строгим, однозначным, выразить на языке математики), пригодном для передачи и обработки в некотором информационном процессе. В широком смысле в понятие обработки информации входит кодирование передача хранение преобразование с целью решения какой-то задачи. Средства обработки информации - это компьютер - универсальная машина для обработки информации. Компьютеры обрабатывают информацию путем выполнения определенных алгоритмов. Компьютерная обработка данных заключается в выполнении различных операций над электрическими сигналами. В виде комбинации электрических импульсов представляются цифры, команды и правила их выполнения. Электрические схемы производят с сигналами различные операции: складывают, делят, пересылают из одного блока в другой, сравнивают с сигналами, записанными в памяти и в процессе этих действий появляются новые сигналы, которые являются результатами компьютерной обработки данных.
Информационные процессы Получение информации тесно связано с информационными процессами, поэтому имеет смысл рассмотреть отдельно их виды. n. Сбор данных – это деятельность субъекта по накоплению данных с целью обеспечения достаточной полноты. Соединяясь с адекват ными методами, данные рождают информацию, способную помочь в принятии решения. Например, интересуясь ценой товара, его по требительскимисвойствами, мы собираем информацию для того, чтобы принять решение: покупать или не покупать его. n. Передача данных– это процесс обмена данными. Предполагает ся, что существует источник информации, канал связи, приемник информации, и между ними приняты соглашения о порядке обмена данными, эти соглашения называются протоколами обмена. n. Хранение данных это поддержание данных в форме, постоянно готовой к выдаче – их потребителю. Одни и те же данные могут быть востребованы не однажды, поэтому разрабатывается способ их хра нения(обычно на материальных носителях) и методы доступа к ним по запросу потребителя. n. Обработка данных– это процесс преобразования информации от исходной ее формы до определенного результата. Сбор, накопление, хранение информации часто не являются конечной целью информа ционного процесса. Чаще всего первичные данные привлекаются для решения какой-либо проблемы, затем они преобразуются шаг за ша гом в соответствии с алгоритмом решения задачи до получения вы ходныхданных, которые после анализа пользователем предоставля ют необходимую информацию
ПЕРЕДАЧА ДАННЫХ Информация передаётся в виде сообщений от некоторого источника информации к её приёмнику посредством канала связи между ними. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приёмнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением. Информация передается в виде сообщений, определяющих форму и представление передаваемой информации. Примерами сообщений являются музыкальное произведение; телепередача; команды регулировщика на перекрестке и т. д. При этом предполагается, что имеются "источник информации" и "получатель информации". Пример: сообщение, содержащее информацию о прогнозе погоды, передаётся приёмнику (телезрителю) от источника — специалиста-метеоролога посредством канала связи — телевизионной передающей аппаратуры и телевизора; Сообщение от источника к получателю передается посредством какой-нибудь среды, являющейся в таком случае "каналом связи". Так, при передачи речевого сообщения в качестве такого канала связи можно рассматривать воздух, в котором распространяются звуковые волны. Получение информации - это получение фактов, сведений и данных о свойствах, структуре или взаимодействии объектов и явлений окружающего нас мира. Среда передачи данных- любая физическая среда , способная передавать информацию с помощью электромагнитных или других сигналов
Информационные основы. Кодирование данных АБСТРАКТНЫЙ АЛФАВИТ Информация передается в виде сообщений. Дискретная информация записывается с помощью некоторого конечного набора знаков, которые будем называть буквами, не вкладывая в это слово привычного ограниченного значения (типа «русские буквы» или «латинские буквы» ). Буква в данном расширенном понимании – любой из знаков, которые некоторым соглашением установлены для общения. Например, привычной передаче сообщений на русском языке такими знаками будут русские буквы – прописные и строчные, знаки препинания, пробел; если в тексте есть числа – то и цифры. Буквой будем называть элемент некоторого конечного множества (набора) отличных друг от друга знаков. Множество знаков, в котором определен их порядок, назовем алфавитом (общеизвестен порядок знаков в русском алфавите: А, Б, . . . , Я). Рассмотрим некоторые примеры алфавитов. Алфавит знаков правильной шестигранной игральной кости: Алфавит языка блок-схем изображения алгоритмов: Алфавит арабских цифр: 0 1 2 3 4 5 6 7 8 Алфавит шестнадцатеричных цифр: 0 1 2 3 4 5 6 7 8 9 A B C D E F Алфавит римской системы счисления: I V X L C D M 9
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ В канале связи сообщение, составленное из символов (букв) одного алфавита, может преобразовываться в сообщение из символов (букв) другого алфавита. Код-это правило сопоставления каждому конкретному сообщению строго определенной комбинации символов (или сигналов). Процесс преобразования сообщения в комбинацию символов в соответствии с кодом называется кодированием, процесс восстановления сообщения из комбинации символов называется декодированием. Устройства, обеспечивающие кодирование и декодирование, будем называть соответственно кодировщиком и декодировщиком. На рис. приведена схема, иллюстрирующая процесс передачи сообщения в случае перекодировки, а также воздействия помех (см. следующий пункт). Процесс передачи сообщения от источника к приемнику Например: Одно и то же понятие на различных языках может кодироваться различными способами. Например, звук «а» , издаваемый человеком, кодируется в некоторых языках буквой «А» . Буква «А» в азбуке Морзе кодируется так: «» (точка, тире импульсы тока разделенные паузами). В компьютере буква «А» латинского алфавита в привычной для нас десятичной системе кодируется числом « 65» , которое в «привычной» для компьютера двоичной системе (цифры только 0 и 1) кодируется так: « 01000001» . Таким образом, для хранения любой информации в ЭВМ необходимо представлять любые числа в виде некоторого двоичного кода, который записывается и сохраняется в последовательных ячейках ОЗУ 0 и 1.
примеры кодов Азбука Морзе в русском варианте (алфавиту, составленному из алфавита русских заглавных букв и алфавита арабских цифр, ставится в соответствие алфавит Морзе): А. _ К _. _ Ф. . _. 0 _____ Б _. . . Л. _. . Х. . 1. ____ В. __ М __ Ц _. _. 2. . ___ Г __. Н _. Ч ___. 3. . . __ Д _. . О ___ Ш ____ 4. . _ Е. П. __. Щ __. _ 5. . . Ж. . . _ Р. _. Ь, Ъ _. . _ 6 _. . З __. . С. . . Ы _. __ 7 __. . . И. . Т _ Э. . _. . 8 ___. . Й. ___ У. . _ Ю. . __ 9 ____. Я. _. _
Двоичным кодомназывается код, в котором для представления данных используется два различных состояния сигнала: наличие сигнала, отсутствие сигнала (пауза). Отвлекаясь от физической природы сигнала, эти состояния обозначаются символами 0 и 1 соответственно. Тогда двоичные (бинарные) коды представляют собой различные комбинации символов 0 и 1. Все виды данных, обрабатываемых на компьютере, представляют собой бинарные коды. Метод кодирования устанавливает по какому правилу данные будут представлены в виде сигналов. В случае электрических линий передачи данных каждому набору бит будет приведён в соответствие определённый набор уровней электрического сигнала Двоичная система кодирования используется в цифровых вычислительных устройствах, поскольку является наиболее простой и удовлетворяет следующим требованиям: чем меньше значений существует в системе, тем проще изготовить отдельные элементы; чем меньше количество состояний у элемента, тем выше помехоустойчивость и тем быстрее он может работать; простота создания таблиц сложения и умножения - основных арифметических операций над числами (таблица). Таблица – Таблицы сложения и умножения двоичных чисел Сложение 0+0=0 0+1=1 1+0=1 1 + 1 = 10 перенос 1 Умножение 0 • 0=0 0 • 1=0 1 • 0=0 1 • 1=1
Системы счисления Системасчисления способ представления чисел с помощью заданного набора специальных символов. В - это любой системе счисления для представления чисел выбираются некоторые произвольные символы, которые должны быть разными и значение каждого из них должно быть известно [ Для представление чисел в арабской системе счисления используются цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. В римской системе счисления для представления чисел используются символы I, V, X, L, С, D, М, которые соответствуют числам 1, 5, 10, 50, 100, 500, 1000. Существует два вида систем счисления: непозиционные и позиционные. В непозиционной системе счисления значение (вес) символа не зависит от его положения (позиции) в записи числа. Примером непозиционной системы счисления является римская система счисления: ХХХ = Х + Х. В позиционной системе счисления значение (вес) символа изменяется в зависимости от его положения (позиции) в записи числа. Примером позиционной системы счисления является арабская система счисления: 111 = 100 + 1. Для изображения чисел в настоящее время используются в основном позиционные системы счисления. Наиболее распространенной является десятичная система счисления, которая основана на том, что десять единиц каждого разряда объединяются в одну единицу соседнего старшего разряда. Таким образом, каждый разряд имеет вес, равный степени числа 10. Десятичная запись любого числа x основана на представлении этого числа в виде полинома: где каждый коэффициент аi, может быть одним из символов десятичной системы счисления. Любая позиционная система счисления характеризуется своим основанием. Число k единиц какого-либо разряда, объединяемых в единицу более старшего разряда, называют основанием позиционной системы cчисления, а сама система счисления называется k-ичной. Основание системы счисленияэто количество различных символов, используемых для изображения числа в данной системе счисления. За основание системы счисления можно принять любое натуральное число, а так как натуральный ряд чисел бесконечен, то существует бесконечное множество позиционных систем счисления. Например, основанием десятичной системы счисления является число 10, двоичной - число 2; троичной - число 3 и т. д.
n n Для записи произвольного числа в k-ичной системе счисления достаточно иметь k разных цифр ai, i = 1. . . k. Например, в троичной системе счисления любое число может быть выражено посредством цифр 0, 1, 2. Запись произвольного числа х в k-ичной позиционной системе счисления основывается на представлении этого числа в виде полинома где каждый коэффициент аi, может быть одним из символов данной системы счисления. При компьютерной обработке данных используется двоичная и производные от нее восьмеричная и шестнадцатеричная системы счисления (таблица 1. 2). Двоичная система счисления - это система счисления с наименьшим возможным основанием. В ней для изображения числа используются только два символа: 0 и 1. Принятие за основу двоичной системы счисления позволило более просто реализовывать арифметические функции и логические операции над данными.
Единицы информации Порция информации это знание о состоянии объекта, который может находиться только в - одном из двух состояний. Единица информации - это минимальная порция информации. Единица информации называется бит (bit - binary digit). Один знак в двоичном коде, один сигнал или пауза – это минимальная порция информации равная одному биту (1 бит = 0 или 1). Байт (byte) - единица измерения количества информации равная восьми битам (1 байт = 8 бит). Производные единицы информации: 1 Кбайт (Kb) = 1024 b = 210 1 Мбайт (Mb) = 1024 Кb = 220 1 Гбайт (Gb) = 1024 Мb = 230 1 Тбайт (Tb) = 1024 Gb = 240 1 Пбайт (1 Pb) = 1024 Tb = 250 Фундаментальное свойство байта заключается в том, что одним байтом может быть представлено любое натуральное число от 0 до 255, записанное в двоичной системе счисления: 0 → 0000 1 → 00000001 2 → 00000010 3 → 00000011 4 → 00000100 … … 255 → 1111 Таким образом, для двоичного представления 256 натуральных чисел из указанного диапазона достаточного одного байта.
Графическое изображение Схематично байт изображается в виде восьми. байта двоичных разрядов 16 битная платформа Старший разряд Младший Старший разряд Байт 1 Младший разряд Байт 0 Байт используется для представления данных в памяти компьютера. Любой набор данных занимает в памяти один или несколько байтов. Все байты нумеруются, начиная с нуля. Номер байта является его адресом, по которому он отыскивается в памяти. Для адресации памяти используется шестнадцатеричная система счисления. Машинное – машинно- и платформозависимая величина, измеряемая в битах или байтах равная разрядности слово регистров процессора и/или разрядности шины данных. Разрядность – это максимальное количество разрядов двоичного числа, над которыми одновременно может выполняться машинная операция или операция передачи данных. Минимальным адресуемым блоком информации обычно является байт, поэтому машинное слово всегда кратно некоторому числу байт. Машинное слово определяет следующие характеристики компьютера: компьютера разрядность данных, обрабатываемых процессором; разрядность шины данных; максимальное значение беззнакового целого типа, напрямую поддерживаемого процессором; максимальный объём оперативной памяти, напрямую адресуемой процессором. Как правило, в одном машинном слове может быть представлено одно число или одна команда.
Порция информации - это знание о состоянии объекта, который может находиться только в одном из двух состояний. Единица информации – это минимальная порция информации. Как измеряется количество информации? Так, американский инженер Р. Хартли (1928 г. ) процесс получения информации рассматривает как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определяет как двоичный логарифм N. Формула Хартли: I = log 2 N. Количественная мера информации Часто информация кодируется числовыми или символьными кодами. Тогда N =2 i, формула Хартли. где N –количество символов в алфавите (мощность алфавита); 2 – основание системы счисления или разнообразие символов, применяемых в алфавите этого сообщения; i – число разрядов (символов) необходимое для кодирования одного символа.
Пример 1: Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице? Из формулы Хартли N =2 i где N = 256 найдем количество бит (I), необходимое для кодирования одного символа в алфавите 256=2 i , отсюда I=8 бит=1 байт. Всего символов в тексте 192*160=30720 байт. Для хранения такого количества символов потребуется 30 720 байт, или в Кбайтах 30 720/1024=30 Кбайт. Пример 2: Объем сообщения равен 11 Кбайт. Сообщение содержит 11 264 символа. Какова мощность алфавита? Из формулы Хартли N =2 i найдем количество бит (I), необходимое для кодирования одного символа (11*1024*8): 11 264 =8 бит. Тогда мощность алфавита N=28=256. Пример 3: Какое максимальное количество бит потребуется для кодирования целых положительных чисел меньше 60? 1. Сколько двоичных разрядов понадобится для кодирования ближайшего к 60 числа, являющегося степенью числа 2 и расположенного на числовой оси справа от него. Это число 64. 64=26. 6010=1111002 для кодирования 60 необходимо 6 бит Ответ: не более 6 бит.
Вопросы для самоконтроля n n n n n Что такое информатика? Что понимают под информационной системой? Что включает в себя информационная технология? Какие можно выделить этапы развития информационных технологий? Каковы основные черты современной информационной технологии? Что означает понятие «информация» ? В чем заключается адекватность информации? Какие существуют формы адекватности информации? Что представляют собой данные? В чем заключается кодирование данных? Какой код называется двоичным? Коды: прямой, обратный, дополнительный. Что такое система счисления? Какие существуют системы счисления? Что является основанием системы счисления? Как представляется произвольное число в k-ичной позиционной системе счисления? Какие существуют единицы информации? В чем заключается фундаментальное свойство байта? Какие существуют формы представления числовых данных?
Вопросы для самоконтроля n n n n Форматы представления чисел с плавающей точкой? Как представляются символьные данные в памяти компьютера? Как кодируется растровое изображение? Что является базовым элементом векторного изображения? Что является основой цветовой модели? В чем заключается формат представления восьмибитных цветов? Как кодируются звуковые данные? Какова физическая структура магнитного диска? Как осуществляется запись данных на магнитный диск? Какова логическая структура магнитного диска? Как определить емкость магнитного диска? В чем заключается процедура форматирования диска? Как осуществляется запись данных на оптический диск?


