Презентация_Распознавание образов.ppt
- Количество слайдов: 20
Основы искусственного интеллекта Распознавание образов 1
Определения § Распознавание образов (объектов, сигналов, ситуаций, явлений или процессов) – это задача идентификации объекта или определение каких-либо его свойств по его изображению (оптическое распознавание) или аудиозаписи (акустическое распознавание) и другим характеристикам. 2
§ Образ - подмножество объектов, обладающих общими существенными свойствами. § Адаптация - это процесс изменения параметров и структуры системы, а возможно - и управляющих воздействий, на основе текущей информации с целью достижения определенного состояния системы при начальной неопределенности и изменяющихся условиях работы. § Обучение - это процесс, в результате которого система постепенно приобретает способность отвечать нужными реакциями на определенные совокупности внешних воздействий. 3
§ Методика отнесения элемента к какомулибо образу называется решающим правилом. § Метрика - способ определения расстояния между элементами универсального множества. Чем меньше это расстояние, тем более похожими являются объекты (символы, звуки и др. ) - то, что человек распознаёт. Обычно элементы задаются в виде набора чисел, а метрика - в виде функции. 4
Примеры задач распознавания образов: § § распознавание букв; распознавание штрих-кодов; распознавание автомобильных номеров; распознавание лиц и других биометрических данных; § распознавание речи. 5
Методы распознавания образов Метод перебора. Анализ характеристик образа. Использование искусственных нейронных сетей 6
1. Метод перебора § Производится сравнение с базой данных, где для каждого вида объектов представлены всевозможные модификации отображения. Например, для оптического распознавания образов можно применить метод перебора вида объекта под различными углами, масштабами, смещениями, деформациями и т. д. § Для букв нужно перебирать шрифт, свойства шрифта и т. д. § В случае распознавания звуковых образов, происходит сравнение с некоторыми известными шаблонами (например, слово, произнесенное несколькими людьми). 7
Один из используемых алгоритмов – это структурный. § Это метод распознавания одинарных бинарных образов, основанный на построении структуры (остова) этих образов и выделения из остова ребер и узлов. Далее по соотношению ребер, их числу и числу узлов строится таблица соответствия образам. Так, например, остовом круга будет один узел, остовом буквы П - три ребра и два узла, причем ребра относятся как 2: 2: 1. В программировании данный метод имеет несколько возможных реализаций. 8
Метод поточечное процентное сравнение с эталоном. § Осуществляется некоторая предобработка, для получения инвариантности относительно размера и положения, затем осуществляется сравнение с заготовленной базой эталонов изображений - если совпадение больше некоторой отметки, то считают образ распознанным. 9
2. Анализ характеристик образа § В случае оптического распознавания это может быть определение различных геометрических характеристик. § Звуковой образец в этом случае подвергается частотному, амплитудному анализу и т. д. Один из методов – это инвариантные числа. § Из геометрии образов можно выделить некоторые числа, инвариантные относительно размера и поворота образов, далее можно составить таблицу соответствия этих чисел конкретному образу (почти как в алгоритме остова). Примеры инвариантных чисел - число Эйлера, эксцентриситет, ориентация (в смысле расположения главной оси инерции относительно чего-нибудь тоже инвариантного). 10
3. Использование искусственных нейронных сетей (ИНС) § Метод требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, его отличает более высокая эффективность и производительность. § Нейросети иногда дают весьма интересные результаты, засчет своей нелинейной структуры. § Некоторые нейросети способны распознавать образы инвариантные относительно поворота без какой либо внешней предобработки. Так, например, сети на основе неокогнейронов способны выделять некоторые характерные черты образов, и распознавать их как бы образы не были повернуты. 11
Общая структура системы распознавания и этапы в процессе ее разработки 12
Характерные черты задач распознавания Преобразование исходных данных к виду, удобному для распознавания Собственно распознавание (указание принадлежности объекта определенному классу) 13
Типы задач распознавания Задача распознавания отнесение предъявленного объекта по его описанию к одному из заданных классов Задача приведения исходных данных к виду, удобному для распознавания Задача автоматической классификации разбиение множества объектов, ситуаций, явлений по их описаниям на систему непересекающихся классов (таксономия, кластерный анализ, самообучение) Динамическое распознавание и динамическая классификация Задача выбора информативного набора признаков при распознавании Задача прогнозирования – суть предыдущий тип, в котором решение должно относиться к некоторому моменту в будущем 14
Современные разработки в области распознавания изображений Целый ряд компаний — от таких широко известных производителей мышей и клавиатур, как Logitech, до малознакомых Canesta (http: //www. canesta. com/), Tyzx, Anoto(http: //www. anoto. com/), а также такие гиганты, как IBM, Intel и Microsoft, работают в области естественных интерфейсов и нетрадиционных способов ввода данных. Например, Intel занимается компьютерным зрением, что со временем позволит управлять компьютером при помощи жестов. Проекты, связанные с технологией распознавания рукописного текста, есть практически во всех крупных компаниях, в продаже стали появляться и виртуальные клавиатуры, мыши и даже такие экзотические средства управления, как перчатки с датчиками, следящими за изгибом пальцев. 15
Современные разработки в области распознавания изображений Разработана система распознавания образов, которая позволяет выделить интересующую часть изображения, причем получить картину, содержащую не только цвет каждого элемента, но и расстояния до него. В основе разработки лежит специализированный чип, выполняющий алгоритм распознавания и быстро обнаруживающий подобие в двух потоках видеоизображений, разбитых на квадраты. Чип 33 -мегагерца Deep. Sea способен выполнять такое сравнение над изображениями размером 512 х512 пикселов 125 раз в секунду, но потребляет при этом гораздо меньше энергии, чем универсальные процессоры вроде Intel Pentium. Еще одна важная разработка — это технология, извлекающая 3 D-информацию из двумерных изображений. 16
Современные разработки в области распознавания изображений Нью-йоркская компания Essential Reality выпустила управляющую перчатку. Это устройство представляет собой некую кибернетическую руку — перчатку с датчиками, фиксирующими изменение положения реальной руки, на которую она надета в пространстве. Движения ладони и пальцев посылают, таким образом, информацию компьютеру о реальных жестах пользователя и дают ему возможность управлять происходящими процессами. Использовать такую перчатку можно и как обычную мышь с расширенными возможностями, например для рассматривания с разных сторон трехмерных объектов. Само устройство — беспроводное, а с компьютером (или игровой приставкой) базовая станция общается через USB-интерфейс. В устройстве использованы гибкие датчики и следящая система разработки Essential Reality. Разработчики уверяют, что скоро подобная система заменит и клавиатуру, и мышь, а в будущем может применяться и в военной индустрии, и в компьютерном дизайне, и в медицине. 17
На выставке в Ганновере было представлено несколько моделей виртуальных клавиатур. Модель представляла собой комплект, состоящий из браслета, который надевается на запястье, и нескольких колец на пальцы. Считывая движения запястья и пальцев, устройство выводит нужные буквы на экран. Последняя версия такой «клавиатуры» использует для связи беспроводной интерфейс Bluetooth. Устройство также позволяет имитировать клавиатуру на любой гладкой поверхности. Scurry следит за угловыми отклонениями пальцев, определяя моменты, когда пальцы «касаются» невидимых клавиш. «Клавиатура» устроена так же, как и другие манипуляторы: датчики движения крепятся к пальцам и фиксируют напряжение мышц и угол наклона пальцев в пространстве — то есть Scurry действует по принципу гироскопа. 18
Система Eye-Controlled Interaction (EYCIN) system, разработанная в немецком институте Фраунхофера (Fraunhofer Institute), состоит из монитора с закрепленной на нём камерой, следящей за глазом пользователя и специализированного распознающего ПО, использующего алгоритм триангуляции. Курсор движется за взглядом, а остановка последнего на полсекунды равносильна щелчку мыши. Перед тем, как быть нажатой, активная кнопка дважды изменит свой цвет, давая пользователю возможность отменить выбор. 19
Выводы Распознавание образов (объектов, сигналов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно от первого до последнего дня своего существования. Для этого он использует огромные ресурсы своего мозга. Похожие действия наблюдаются в биологии, в живой природе, а иногда даже в неживой. Кроме того, распознавание постоянно встречается в технике. Можно считать механизм распознавания всеобъемлющим. В повседневной деятельности человек постоянно сталкивается с задачами, связанными с принятием решений, обусловленных непрерывно меняющейся окружающей обстановкой. В этом процессе принимают участие: органы чувств, с помощью которых человек воспринимает информацию извне; центральная нервная система, осуществляющая отбор, переработку информации и принятие решений; двигательные органы, реализующие принятое решение. Но в основе решений этих задач лежит распознавание образов. Основные причины замены человеческого участия в задачах распознавания: - освобождение человека от однообразных операций для решения других более важных задач; - повышение качества и скорости принимаемых решений. 20
Презентация_Распознавание образов.ppt