Компьютерное зрение.ppt
- Количество слайдов: 35
Компьютерное зрение
План 1. Введение в компьютерное зрение. Примеры решаемых задач. Краткие основы представления изображений внутри компьютера. 2. Получение бинарных изображений. Анализ бинарных изображений. Подсчет и маркировка связанных компонент. Распространенные операции над бинарными изображениями и их практическое применение. 3. Основы распознавания образов - классификация изображений. Выделение признаков и представление объекта в виде вектора признаков. Деревья решений. Байесовский подход к принятию решений. Нейронные сети (отсылка в сторону соответствующего курса). 4. Фильтрация изображений и обнаружение низкоуровневых признаков. Выравнивание гистограммы, удаление шума, удаление малых компонент. Сглаживание изображения. Обнаружение краев. 5. Обнаружение локальных особенностей изображения. Sift, Surf, примеры использования.
Что это такое? Цель компьютерного зрения заключается в формировании полезных выводов относительно объектов и сцен реального мира на основе анализа изображений, полученных с помощью датчиков.
Практическое применение n Поиск в базе данных изображений
Практическое применение n Контроль отверстий в поперечных балках
Практическое применение n Контроль медицинских изображений головы человека
Практическое применение n Оценка снежного покрова по спутниковым изображениям
Практическое применение n Анализ сцен, содержащих детали промышленного производства
Практическое применение n Робототехника
Практическое применение n Обработка сканированных страниц текста
Практическое применение Falcon – поиск плакатов наружной рекламы
Немного истории Началом можно считать 1970 е n Изначально представлялось простой задачей n
1970 е Одни из первых алгоритмов: n Line labelling n Stereo correspondence n Intrinsic images (как работает светотень)
1970 е David Marr, книга Vision (1982) предлагал 3 уровня: n Теория вычислений (computational theory). Какова цель вычислений, какие ограничения существуют или могут быть введены для работы с проблемой?
1970 е n Представления и алгоритмы (representations and algorithms). Как должна быть представлена входная, выходная и промежуточная информация, какие алгоритмы должны использоваться для получения желаемого результата?
1970 е Аппаратное воплощение (hardware implementation). Как данные представления и алгоритмы ложатся на более низкий уровень, будь то биологическая система зрения или специальный кусок кремния? Соответственно, какие ограничения аппаратного обеспечения можно использоваться, чтобы направить выбор представления и алгоритмов? С растущей популярностью использования GPU для решения задач компьютерного зрения, данный вопрос не менее актуален сегодня. n
1980 е n Image pyramids (для смешивания и других задач) -> Gaussian pyramid.
1980 е n Shape from X алгоритмы – восстановление формы из затенения, стерео изображений, текстуры.
n Edge and contour detection – обнаружение границ.
1990 е Продолжение исследований во всех ранее упомянутых направлениях n Улучшены Tracking (слежение за объектом) алгоритмы n Использование множества стереоизображений для восстановления 3 дповерхности n
1990 е Использование статистических моделей. n Более плотное взаимодействие с компьютерной графикой (image-based modeling and rendering). n
2000 е Работа с HDR-изображениями n Использование feature-based техник (иногда с обучением) для обнаружения объектов. n
Изображение n В рамках компьютерного зрения, как правило, может рассматриваться как дискретный двумерный массив значений I[r, c] яркости (интенсивности) света, отраженного либо прошедшего сквозь объекты.
Получение изображений
Получение изображений
Обработка изображений
Возможные конфигурации ячеек камеры
Изображения Полутоновое изображение (чернобелое), каждому пикселю соответствует одно значение интенсивности n Бинарное изображение – каждому пикселю соответствует 0 или 1. n
Проблемы с изображениями n n n Разрешение и эффекты дискретизации Геометрические искажения Дисперсия (искажение из-за, например, водяных паров). Блюминг (избыточная яркость) Неоднородности матрицы Хроматическая дисторсия (показатель преломления линзы зависит от длины волны).
Форматы изображений Со сжатием (с потерями и без) n Без сжатия n Как правило, файл состоит из заголовка и собственно данных
Форматы изображений n Простейшие (PBM, PPM, PGM)
Форматы изображений n GIF (Graphics Interchange) – применялся для www, 256 цветный изначально.
Форматы изображений n TIFF (Tag Image File Format) – сжатие с потерями и без. Один из общепринятых издательских форматов.
Форматы изображений n JPEG – метод кодирования с потерями
Групповое сжатие n Один из самых простых методов – группы одинаковых интенсивностей заменяются специальной меткой.


