Кодирование текстовой информации.pptx
- Количество слайдов: 11
КОДИРОВАНИЕ ТЕКСТОВОЙ ИНФОРМАЦИИ Подготовил Мулеев Сергей Ученик 10 а класса
Кодирование информации — процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки.
В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания. Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 0000 до 1111 или соответствующий ему десятичный код от 0 до 255. Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР 1251, СР 866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов. Одному и тому же двоичному коду ставится в соответствие различные символы. Двоичный код 11000010 Десятичный код КОИ 8 СР 1251 СР 866 Мас 194 б В - - ISO
Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы конверторы, которые встроены в приложения. Начиная с 1997 г. последние версии Microsoft Windows&Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов Чтобы определить числовой код символа можно или воспользоваться кодовой таблицей, или, работая в текстовом редакторе Word 6. 0 / 95.
КОДЫ БУКВ, ЗНАКОВ ЦИФР
ТЕКСТОВЫЙ ФАЙЛ Текстовый файл представляет из себя последовательность символов и знаков препинания (принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows) (в современных системах строки разделяются разделителями строк, хотя в прошлом применялось хранение строк в виде записей постоянной или переменной длины). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла. Текстовой файл может содержать как форматированный, так и неформатированный текст.
ПРЕИМУЩЕСТВА И НЕДОСТАТКИ Преимущества: Минимальный объём файла (при малом количестве текстовых данных). Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или ОС, особенно если речь идёт об однобайтных Устойчивость — каждое слово и символ в таком файле самодостаточны, и если случится повреждение такого файла, то в этом случае обычно легче восстановить данные и продолжить обработку остального содержимого — повреждение любого из байтов такого файла никак не сказывается на сохранность остальных. Недостатки: Недостатком больших (и несжатых) текстовых файлов является их низкая информационная энтропия — эти файлы занимают больше места, нежели минимально необходимо. Некоторые операции с текстовыми файлами чрезвычайно неэффективны. Формат текстового файла крайне прост, и его можно изменять текстовым редактором — стандартной программой, имеющейся в наличии во всех ОС и в практически любом устройстве.
ТЕКСТОВЫЙ РЕДАКТОР
Текстовый редактор — компьютерная программа, предназначенная для работы с текстовыми файлами — их создания, просмотра, внесения изменений, распечатки и т. п. Notepad - входит в состав Microsoft Windows. GNU nano - Свободный редактор для текстового режима. Edit. Plus - текстовый редактор для Windows, предназначенный для программирования и web разработки. Pspad - Текстовый редактор с подсветкой синтаксиса, поддержкой скриптов и инструментами для работы с HTMLкодом. Texter - текстовый редактор для Windows. Word. Pad - входит в состав Microsoft Windows; Open. Office. org Writer; Microsoft Word; Abi. Word; Atlantis Word Processor.
ШИФРОВАНИЕ Шифрование — это кодирование с целью обеспечить секретность хранимых или передаваемых сообщений.
ПРИМЕР ШИФРОВАНИЯ


