Скачать презентацию Кодирование текстовой информации http www gifpark su FLO Скачать презентацию Кодирование текстовой информации http www gifpark su FLO

kod_text.ppt

  • Количество слайдов: 14

Кодирование текстовой информации Кодирование текстовой информации

http: //www. gifpark. su/FLO. htm Ø Ø Ø Текстовая информация – это информация, выраженная http: //www. gifpark. su/FLO. htm Ø Ø Ø Текстовая информация – это информация, выраженная с помощью естественных и формальных языков в письменной форме (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы). Для представления текстовой информации достаточно 256 различных знаков. По формуле N=2 I можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак: N = 2 I => 256 = 2 I => 28 = 2 I => I = 8 битов. Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе (в виде 0 и 1). Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 0000 до 1111 (в десятичном коде от 0 до 255) Человек различает знаки по их начертанию, а компьютер - по их двоичным кодам. При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

Кодовая таблица ASCII В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code Кодовая таблица ASCII В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Кодовая таблица ASCII Кодовая таблица ASCII

КОИ-8 (код обмена информацией, 8 битов)— восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв КОИ-8 (код обмена информацией, 8 битов)— восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ 8. Эта кодировка применялась еще в 70 -ые годы на компьютерах серии ЕС ЭВМ, а с середины 80 -х стала использоваться в первых русифицированных версиях операционной системы UNIX.

КОИ 8 ( «Код обмена информацией, 8 -битный» ) КОИ 8 ( «Код обмена информацией, 8 -битный» )

От начала 90 -ых годов, времени господства операционной . системы MS DOS, остается кодировка От начала 90 -ых годов, времени господства операционной . системы MS DOS, остается кодировка CP 866

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 -5.

Unicode В конце 90 -ых годов появился новый международный стандарт Unicode, который отводит под Unicode В конце 90 -ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Пример Представьте в форме шестнадцатеричного кода слово «ЭВМ» . Ø CP 1251: 221 194 Пример Представьте в форме шестнадцатеричного кода слово «ЭВМ» . Ø CP 1251: 221 194 204

Ø Ø Ø Ø Ø Кодирование текстовой информации Для кодирования одного символа в компьютере Ø Ø Ø Ø Ø Кодирование текстовой информации Для кодирования одного символа в компьютере обычно используется 1 байт (8 бит). С помощью 8 бит можно закодировать 256 различных символов (28= 256). Эти коды хранятся в специальной таблице. Одной из самых первых была таблица, разработанная в США в институте стандартизации. Этот институт ввел в действие таблицу кодов ASCII (American Standard Code for Information Interchange - стандартный код информационного обмена США). Таблица ASCII разделена на две части. Первая - стандартная - содержит коды от 0 до 127. Вторая - расширенная - содержит символы с кодами от 128 до 255. Первые 32 кода отданы производителям аппаратных средств, они называются управляющие, эти коды управляют выводом данных. Им не соответствуют никакие символы. Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, знакам арифметических действий и некоторым вспомогательным символам. Коды расширенной таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы. Все буквы в алфавите расположены по алфавиту, а цифры - по возрастанию. Кроме кодировки ASCII существуют и другие системы кодирования: Windows 1251, КОИ-8 и др. Все вышеназванные системы кодирования используют для кодирования 1 символа - 8 бит или 1 байт. В 1991 году была предложена 16 -битная система Unicode (Юникод). Для представления каждого символа в этой системе используются 2 байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASCII.

Кодовая таблица Windows (CP 1251) Кодовая таблица Windows (CP 1251)