9fd3c13bb9503859d682396af217bf6f.ppt
- Количество слайдов: 28
Нейросемантические структуры как инструментарий для построения Баз Знаний Бодякин В. И. Институт проблем управления им. В. А. Трапезникова РАН, Москва , E-mail: body@ipu. ru http: //www. informograd. narod. ru , служ. тел. : 334 -92 -39 1
Схема формирования БЗ по инноватике Экспертыаналитики Программист База знаний Предметная область Интернет Документы, обзоры, аналитика, ответы на запросы, … ≈ 1012 -14 байт/сутки СМИ ≈ 1012 б/с НТП ≈ 108 б/с Специальность ≈ 103 -4 б/сутки Интеллектуальный инструментарий по формированию и пополнению БЗ Пользователь КПД < 2% Ассоциация пользователей 2
НСС Предметная область Алгоритм НСС 110010100110100 Текстовая форма При моделировании предметных областей (ПО) специализированными нейросетями (НСС) было обнаружено явление автокластеризации. Которое выражалось в том, что при минимизации ресурсов нейросети, затрачиваемых на отображение реальных предметных областей, структура нейросети приобретала топологическую гомоморфность причинно-следственной структуре физических процессов произвольной ПО. 3
Нейросемантическая форма (НСС) представления информации Предметная область Процесс А N-элемент (3, 2) НСС Образ А Алгоритм НСС 01100101011010001101101001 ТФ описания процесса А При минимизации затрат (памяти) НСС получаем: процесс предметной области N‑элементу (образу), при этом, структура образов НСС гомоморфна структуре процессов ПО ! 4
Автоструктуризация на нейросемантических структурах Lim RИС = f(число N-элементов, число связей) в битах 0 при t TФИС = объем текстовой информации в ИС в битах или RИС / TФИС 0 при t и RИС < const при t Т Примеры: а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS> правильно выделяются все процессы: <MAK><RIS><MAK><DUB>; б)<ДОМЗЕБРЫСКИТНАДОМДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>, - выделяются все процессы: <ЗЕБРЫ><СКИТ><ДОМ><НА><В>. сдвиг алфавита А в кодах ASCII в примере б) <ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на +1 <? IGB@<KVLECMH; ? IG=H; ? IG=LECM =H; LECM==B<KVH; =H; {> на -133 5
НСС – это пример формального преобразования количественной текстовой формы представления информации в качественно новую форму Критерии достаточности ТФ: а) все пространство состояний процессов ПО; б) если человек может правильно структурировать данную ТФ в непривычной, но взаимнооднозначной нотации, в) наличие характерных особенностей динамического процесса при минимизации ресурса RИС Min ТФ = 2 N-1, где N – число процессов ПО. 6
Расширив свойства формального нейрона введением в него относительности времени активации входов, получим нейроподобный N-элемент. U*(t) = U(t) / Umax U(t)= Fi(P 1*X 1(t 0) P 2*X 2 T 2*(t 2 - t 0) … Pk*Xk Tk*(tk- t 0)) 1 F 1 -20(P, T) = 1 1 1 … 0 1 k 7
Объединенные N-элементы в НСС представляют многодольный иерархический граф Межслойные связи N-элементов формируются входящей информаций. Процесс заполнения связями (памяти) НСС идет слева направо и снизу вверх (долговременная память, кратковременная память и резерв). В слое N-элементы независимы – максимальная распараллеливаемость. Время распознавания НСС монотонно 1 обобщ. такту, по мере работы. 8
Классическая (файловая, ТФ) и нейросемантическая парадигмы автоматизации информационных процессов База знаний Алгоритм if<> then<> … if<> then<> Пользователь Аналитик, программист Алгоритм БД Предметная область Форма НСС АЦП- 01011010001101101001010 110100110110100101101 000101011011001000110110100101101 ЦАП 0110010101101000110110100101010 Алгоритм НCC Текстовая форма 9
Основные свойства НСС Нейросемантическая форма (НСС) представления информации гомоморфна причинно-следственной структуре процессов ПО. - N-элемент (образ) НСС процесс ПО, (информ. модель ПО или ее онтология). - связи НСС отражают порядок взаимосвязи процессов ПО. Каждый N-элемент имеет свое имя (номер слоя, номер в слое). …авасасвсавасв Текстовая форма Топология НСС дает: - всю статистику процессов ПО; - поле текстовой энтропии; - целостность и аналитичность; -… НСС гораздо информативнее ТФ. т. е. 10
Дополнительные свойства НСС - ассоциативность (через N-эл. пред. слоя) - прогностичность (прич. -след. связи) - иерархичность (вверх-вниз) - локальная интеграция и анализ - полный образный анализ ПО - однотипность (множество слоя) - кратковременная и долговрем. памяти - максимальная распараллеливаемость - открытость и наращиваемость - гипертекстовость (навигация по N-эл. ) - произвольность ПО - демонстрация абстракций, творчества … -… 11
Дополнительные свойства НСС - ассоциативность (через N-эл. пред. слоя) - прогностичность (прич. -след. связи) - иерархичность (вверх-вниз) - локальная интеграция и анализ - полный образный анализ ПО - однотипность (множество слоя) - кратковременная и долговрем. памяти - максимальная распараллеливаемость - открытость и наращиваемость - гипертекстовость (навигация по N-эл. ) - произвольность ПО - демонстрация абстракций, творчества … -… 12
Дополнительные свойства НСС - ассоциативность (через N-эл. пред. слоя) - прогностичность (прич. -след. связи) - иерархичность (вверх-вниз) - локальная интеграция и анализ - полный образный анализ ПО - однотипность (множество слоя) - кратковременная и долговрем. памяти - максимальная распараллеливаемость - открытость и наращиваемость - гипертекстовость (навигация по N-эл. ) - произвольность ПО - демонстрация абстракций, творчества … -… 13
Характеристики ассоциативной памяти на базе НСС: - время доступа, - коэффициент компрессии-сжатия, - надежность хранения информации и др. ) имеют тенденцию к улучшению, как в среднем, так и в абсолютных значениях, по мере роста объема вводимой информации из ПО. 14
ВИД ИСХОДНОЙ ТФ (1000 символов) на которой будет построена НСС А. С. Иванов ст. инж. , оклад 8500 руб. ; М. А. Сидорян мнс, оклад 5505 руб. ; С. С. Петровичев ст. инж. , отдел 17, 850 руб. ; М. А. Иванидзе холост, ст. инж. , оклад, 8500 руб. ; М. А. Сидорян женат, двое детей. ст. инж. , оклад 7200 руб. ; Д. А. Иваншвили инженер, оклад 4055 руб. ; М. М. Петров, оклад 6050 руб. ст. инж. ; И. И. Петров, оклад 9050 руб. , вед. инж. ; С. С. Иванян оклад 8550 руб. , инженер; М. К. Сидоров, инженер, оклад 5000 руб. ; Ф. А. Иваненко, оклад 4700 руб. холост; А. С. Иванов ст. инж. , оклад 8500 руб. , холост; И. Д. Петрян, оклад 9000 руб. вед. инж. ; В. А. Ивановский вед. инж. , оклад 9500 руб. ; А. В. Ивановский женат, четверо детей. оклад 7600 руб. ; Ф. Ф. Петров мнс, оклад 5650 руб. ; А. А. Иванов, оклад 6500 руб. вед. инж. ; И. И. Иванский зав. отделом, оклад 7440 руб. ; М. К. Сидоров, оклад 8020 руб. ст. инж. ; А. Д. Иваншвили ст. инж. , оклад 8500 руб. ; С. С. Иванян ст. инж. , оклад 8500 руб. ; М. М. Иванидзе ст. инж. , оклад 4000 руб. ; А. М. Иваншвили вед. инж. , оклад 5605 руб. ; М. А. Петров, оклад 9000 руб. вед. инж. ; А. А. Иванов вед. инж. , уволен 05. 05. ; 15
Вид ТФ в другой нотации (ASCII-1) -Р-Зб. Ямнб рс-зме-+ нйк. Яг 7/4/ Л-ї-Зб. Ямзгжд нкнрс+ пта-: ф рс-зме+ нйк. Яг 7/// Р-Р-Одспнбзцдб пта-: рс-зме-+ нсгдк 06+ нйк. Яг 74// пта: Л-ї-Рзгнпюм лмр+ нйк. Яг 44// Л-ї-Одспюм пта-: едм. Яс+ гдсди- гбнд рсзме-+ нйк. Яг 6/5/ ї-Р-Зб. Ямчбзкз пта-: змедмдп+ нйк. Яг 3/3/ Л-їпта-: Одспнб+ нйк. Яг 7/4/ рс-зме-: пта- ї-Г-Одспюм бдг-зме-+ нйк. Яг 8/// пта -: Р-Р-Зб. Ямюм змедмдп+ нйк. Яг 74// Л-Йпта-: Рзгнпнб+ нйк. Яг 4/4/ змедмдп: Л-Й-Зб. Ямдмйн+ пта- нйк. Яг 3/2/ птаф нкнрс: З-З-Одспнб+ нйк. Яг 8/2/ бдг-зме-: пта- З-З-Зб. Ямнбрйзи бдгзме-+ нйк. Яг 804/ ї-Р-Рзгнпнбрйзи пта-: едм. Яс+ гдсдиспнд нйк. Яг 80// пта-: ї-Р-Одспдмйн лмр+ нйк. Яг 4/// ї-їпта-: Зб. Ямзгжд+ нйк. Яг 84// зме-: З-З-Рзгнпрйзи Ябпта- ж нсгдкнл+ нйк. Яг 64// Л-Й-Рзгнпнб+ пта-: нйк. Яг 7/6/ рс-зме-: пта- Р-РРзгнпцтй+ нйк. Яг 746/ рс-зме-: пта- ї-Г-Зб. Ямчбзкз рс-зме+ нйк. Яг 74// пта-: Л-Й-Рзгнпюм+ нйк. Яг 474/ рс-зме-: пта- Л-ЛЗб. Ямзгжд рс-зме-+ нйк. Яг 57// З-З-Рзгнпчбзкз пта-: бдг-зме+ нйк. Яг 88// пта-: Л-ї-Двнпнб нйк. Яг 8/8/ бдг-зме-: ї-ї-Зб. Ямнб пта- бдгзме-+ тбнкдм /4 -/4 -/4 -: я 16
Автоматически сформированный гиперграф NSS структуры N-элементов === Max compress = 1. 70 (!!!) === NN kb L_N w buf inf_sod cods - sloi=1 slovar=82 12345678910 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 - … 6 4 8 8 8 8 7 7 6 6 6 2 5 5 5 4 4 4 4 4 3 3 3 22 24 10 7 3 2 5 3 3 3 2 2 31 7 3 3 2 2 2 5 4 2 2 2 3 3 2 256 175 172 166 158 156 144 140 122 120 120 111 101 93 93 91 91 91 81 79 75 75 75 54 54 52 <оклад > < руб> < ст. инж. > <вед. инж. > <А. Иванов> <холост; /> <. Петров> <инженер> <А. Иван> <Иванов> <Иванян> <К. Сидо> <швили > <детей. > <, > <. ; /М. > <. ; /А. > <ский > <. ; /Ф. > <Сидор> <женат> <8500> <Иван> <отде> <идзе> <А. С. > <05. > <С. С> <ров> NN kb L_N w buf 12345678910 11 12 13 14 - … inf_sod cods - sloi=2 slovar=63 7 34 2 238 <А. С. Иванов ст. инж. , оклад 8500 руб> 26 10 3 15 8 20 2 228 <9000 руб. вед. инж. ; /> 74 31 80 2 34 4 70 71 2 8 18 108 <, оклад > 15 1 2 9 6 97 < руб. ; /М. > 2 16 3 10 2 88 < ст. инж. ; /> 3 70 71 7 24 1 70 <И. И. Иванский зав. отделом> 33 33 23 18 47 24 5 2 9 2 69 <К. Сидоров> 12 29 2 69 <, инженер> 15 8 2 6 5 64 <00 руб> 31 2 2 5 4 61 < руб. > 2 69 2 7 2 59 <А. Сидор> 32 20 2 3 kb L_N w<. ; /> inf_sod cods 71 sloi=3 slovar=35 3 41 35 NN buf 2 - 4 63 1 12 <А. С. Иванов 28 69 2 40 <С. С. > 1 3 ст. инж. , оклад 8500 руб. , холост; /И. Д. 2 39 <000> оклад > 31 1 80 21 3 2 3 4 5 6 7 - 3 3 3 51 46 40 44 33 33 1 1 1 12 11 11 11 <9000 руб. вед. инж. ; /В. А. Ивановский вед. инж. , ок <А. С. Иванов ст. инж. , оклад 8500 руб. ; /М. А. Сидор> <отдел 17, 850 руб. ; /М. А. Иванидзе холост, > 3 <А. Сидорян женат, двое детей. ст. инж. , оклад > <Д. А. Иваншвили инженер, оклад 4055> 26 3 4 <9500 руб. ; /А. В. Ивановский женат, > 58 9 2 8 - NN 46 kb 1 L_N w<четверо детей. оклад 7600 руб. ; /Ф. Ф. Петров мнс> 3 11 buf inf_sod cods - sloi=4 slovar=12 … 1 - 3 114 1 12 <отдел 17, 850 руб. ; /М. А. Иванидзе холос руб. ; /М. А. Сидорян женат, дво 8500 оклад > 4 15 5 2 - 3 111 1 12 <000 руб. ; /Ф. А. Иваненко, оклад 4700 руб холост; /А. С. Иванов ст. инж. , оклад … - sloi=7 8500 руб. NN kb L_N w buf inf_sod cods … slovar=1 холост; /И. Д. Петрян, оклад > 18 28 1 17
оклад Иван швили оклит Файл запроса в НСС Динамика реакции НСС на запрос ====== Номер запроса=1 Запрос = 'оклад' Max_sloi=2 j_max=49 UT= 1 T_astr=1 запрос = <о> => реакция = <енко, > Max_sloi=1 j_max=68 UT= 50 T_astr=2 запрос = <ок> => реакция = <к> Max_sloi=1 j_max= 4 UT= 36 T_astr=3 запрос = <окл> => реакция = <оклад> Max_sloi=3 j_max= 2 UT= 53 T_astr=4 запрос = <окла> => реакция = <оклад > Max_sloi=4 j_max= 9 UT= 1 T_astr=5 запрос = <оклад> => реакция = <6500 руб. вед. инж. ; И. И. Иванский зав. отделом, оклад 7440 руб. ; > ====== Номер запроса=2 Запрос = 'Иван' Max_sloi=2 j_max=41 UT= 1 T_astr=1 запрос = <И> => реакция = <И. Д. Петрян> Max_sloi=1 j_max=43 UT= 50 T_astr=2 запрос = <Ив> => реакция = <во> Max_sloi=1 j_max= 6 UT= 56 T_astr=3 запрос = <Ива> => реакция = <Иван> Max_sloi=3 j_max=26 UT= 36 T_astr=4 запрос = <Иван> => реакция = <А. С. Иванов> ====== Номер запроса=3 Запрос = 'швили' Max_sloi=1 j_max=12 UT= 4 T_astr=1 запрос = <ш> => реакция = <швили> Max_sloi=1 j_max=43 UT= 50 T_astr=2 запрос = <шв> => реакция = <во> Max_sloi=1 j_max=12 UT= 36 T_astr=3 запрос = <шви> => реакция = <швили> Max_sloi=3 j_max=10 UT= 1 T_astr=5 запрос = <швили> => реакция = < 4000 руб. ; М. А. Иваншвили вед. инж. , оклад 56> ====== Номер запроса=4 Запрос = 'оклит' Max_sloi=2 j_max=49 UT= 1 T_astr=1 запрос = <о> => реакция = <енко, > Max_sloi=1 j_max=68 UT= 50 T_astr=2 запрос = <ок> => реакция = <к> Max_sloi=1 j_max= 4 UT= 36 T_astr=3 запрос = <окл> => реакция = <оклад> 18
Информация – f(ПО(S)) причинно-связанная <X, Y, E+> последовательность образов. (деятельностная единица ИС) Знание – f(ПО(S), ИС(S)) причинно-связанное E+объединение в НССn образов о ПО с образами о состоянии ИС. (семантические закономерности) Знаниеi – f(ПО(S), ИС(S)1 , … ИС(S)i-1) 19
Пример категории знание - "логические высказывания". В текстовой форме они обязательно содержат ритмические п о в т о р е н и я ! |ВСЕ| |ВОЛК|И| |СЕР|Ы||А||ЕСТЬ| |ВОЛК|, ||ЗНАЧИТ|, |А||ЕСТЬ| СЕР|ЫЙ|<E+> НСС |ВСЕ||ПЕТУХ|И||КРАСИВ|Ы||В||ЕСТЬ||ПЕТУХ|, ||ЗНАЧИТ|, |В||ЕСТЬ|КРАСИВ|ЫЙ|<E+> в НСС 2 автоматически строится структура: |ВСЕ| |X 1 |И| | X 2 |Ы|, |X 3| |ЕСТЬ| |X 1 |, | |ЗНАЧИТ|, |X 3| |ЕСТЬ| X 2 |Ы|Й|<E+> t 1 t 3 t 2 <ВСЕ ПЛЮКИ КАНЫ, ОН ЕСТЬ ПЛЮК, ЗНАЧИТ, ОН ЕСТЬ > t 2+Ы|Й <КАНЫЙ> <ВСЕ ЛЮДИ СМЕРТНЫ, СОКРАТ ЕСТЬ ЛЮД, ЗНАЧИТ, СОКРАТ ЕСТЬ >, ИС в своей грамматике выдаст: <СМЕРТНЫЙ>. Таким образом, все типы логических высказываний произвольной ПО покрываются механизмом НСС 2 20
Язык диалога: <ситуация ПО> <реакция ИС> <оценка> Xi , Yj : Ek+ (Yj Xj) Xj , Yn : Eb+ (Yn Xn) t … Прототип компьютерного интерфейса “человек-ИP“ Пользователь 21
СПАСИБО ЗА ВНИМАНИЕ По всем вопросам Проекта обращаться к Бодякину Владимиру E-mail: body@ipu. ru www. informograd. narod. ru/ тел. (495)334 -92 -39 в ИПУ тел 1 -346 22
1. Проблемы автоматизации в материальной и информационной сферах производств За последние 200 -300 лет автоматизация в промышленности дала более чем ~ 100 кратное повышение производительности труда За это же время, в информационной области человеческой деятельности, производительность труда возросла не более чем в ~ 3 -5 раз. 23
В "экономике знаний" нет более ценного ресурса, чем ИНФОРМАЦИЯ и ЗНАНИЕ В развитых странах на долю новых ИТтехнологий приходится от 70 до 80% прироста ВВП. США на экспорте наукоемких технологий зарабатывают в год 700 млрд. долл. , Япония - порядка 400 млрд. долл. 24
Ежемесячные объемы мирового цифрового контента слабоструктурированной информации (тексты на ЕЯ, материалы СМИ, ТВ), а также телеметрии, и различных БД и БЗ оцениваются в ~ 1020 байт Главные проблемы экономики знаний: - нет четких определений базовых понятий: «сигнал» , «информация» , «знание» , «семантика» , «целевая функция» … ; - отсутствие технологий автоматизированной ообработки и недостаточная "мощность" экспертов. Основания для надежд решения проблем: - наличие социального заказа; - возросшая мощность вычислительной техники; - формализуемость когнитивных функций человека. 25
Для решения проблем информационной экономики, необходимо знать: - "Какие" принципы лежат в основе саморазвивающихся информационных систем (СИС) ? - "На каких" механизмах построена переработка информации в СИС ? - "Как" построить или промоделировать на ЭВМ саморазвивающуюся информационную систему ? Вывод: есть острейшая потребность в крупномасштабных СИС и нет никаких принципиальных "запретов" на ее построение. 26
Современные технологии автоматизации решения задач пользователя t 1 t 2 Аналитикпостановщик Программист Отказ - Тексты описания предметной области t 5 "Неформализуемо!" Текст задачи t 3 Текст решения от ЭВМ Текст решения от эксп. Экспертыаналитики Пользователь t 4 Инженер Язык ЭВМ Аналитикинтерпретатор Время решения задач: ЭВМ Т 1 = t 1+ t 2+ t 4 + n t 3, Т 2 = t 4 Эксперты Т 1 = t 5 Т 2 ( t 5 Т 1 >> t 4) Качество решения задач: ограниченное и удовлетворительное долгое, субъективное и приемлемое Стоимость: ЭВМ Т 1 Эксперты Т 1 27
Технологии решения задач пользователя на НСС Тексты описания предметной области Язык Текст задачи t 6 НСС Текст решения от ЭВМ Инженер Пользователь Время решения задач: НСС Т 1>Т 2 ЭВМ Т 2 << Т 1 Качество решения задач: монотонно стремящееся к отличному Стоимость: равна вводу информации 28
9fd3c13bb9503859d682396af217bf6f.ppt