Скачать презентацию Компьютерное зрение План 1 Введение в компьютерное Скачать презентацию Компьютерное зрение План 1 Введение в компьютерное

Компьютерное зрение.ppt

  • Количество слайдов: 35

Компьютерное зрение Компьютерное зрение

План 1. Введение в компьютерное зрение. Примеры решаемых задач. Краткие основы представления изображений внутри План 1. Введение в компьютерное зрение. Примеры решаемых задач. Краткие основы представления изображений внутри компьютера. 2. Получение бинарных изображений. Анализ бинарных изображений. Подсчет и маркировка связанных компонент. Распространенные операции над бинарными изображениями и их практическое применение. 3. Основы распознавания образов - классификация изображений. Выделение признаков и представление объекта в виде вектора признаков. Деревья решений. Байесовский подход к принятию решений. Нейронные сети (отсылка в сторону соответствующего курса). 4. Фильтрация изображений и обнаружение низкоуровневых признаков. Выравнивание гистограммы, удаление шума, удаление малых компонент. Сглаживание изображения. Обнаружение краев. 5. Обнаружение локальных особенностей изображения. Sift, Surf, примеры использования.

Что это такое? Цель компьютерного зрения заключается в формировании полезных выводов относительно объектов и Что это такое? Цель компьютерного зрения заключается в формировании полезных выводов относительно объектов и сцен реального мира на основе анализа изображений, полученных с помощью датчиков.

Практическое применение n Поиск в базе данных изображений Практическое применение n Поиск в базе данных изображений

Практическое применение n Контроль отверстий в поперечных балках Практическое применение n Контроль отверстий в поперечных балках

Практическое применение n Контроль медицинских изображений головы человека Практическое применение n Контроль медицинских изображений головы человека

Практическое применение n Оценка снежного покрова по спутниковым изображениям Практическое применение n Оценка снежного покрова по спутниковым изображениям

Практическое применение n Анализ сцен, содержащих детали промышленного производства Практическое применение n Анализ сцен, содержащих детали промышленного производства

Практическое применение n Робототехника Практическое применение n Робототехника

Практическое применение n Обработка сканированных страниц текста Практическое применение n Обработка сканированных страниц текста

Практическое применение Falcon – поиск плакатов наружной рекламы Практическое применение Falcon – поиск плакатов наружной рекламы

Немного истории Началом можно считать 1970 е n Изначально представлялось простой задачей n Немного истории Началом можно считать 1970 е n Изначально представлялось простой задачей n

1970 е Одни из первых алгоритмов: n Line labelling n Stereo correspondence n Intrinsic 1970 е Одни из первых алгоритмов: n Line labelling n Stereo correspondence n Intrinsic images (как работает светотень)

1970 е David Marr, книга Vision (1982) предлагал 3 уровня: n Теория вычислений (computational 1970 е David Marr, книга Vision (1982) предлагал 3 уровня: n Теория вычислений (computational theory). Какова цель вычислений, какие ограничения существуют или могут быть введены для работы с проблемой?

1970 е n Представления и алгоритмы (representations and algorithms). Как должна быть представлена входная, 1970 е n Представления и алгоритмы (representations and algorithms). Как должна быть представлена входная, выходная и промежуточная информация, какие алгоритмы должны использоваться для получения желаемого результата?

1970 е Аппаратное воплощение (hardware implementation). Как данные представления и алгоритмы ложатся на более 1970 е Аппаратное воплощение (hardware implementation). Как данные представления и алгоритмы ложатся на более низкий уровень, будь то биологическая система зрения или специальный кусок кремния? Соответственно, какие ограничения аппаратного обеспечения можно использоваться, чтобы направить выбор представления и алгоритмов? С растущей популярностью использования GPU для решения задач компьютерного зрения, данный вопрос не менее актуален сегодня. n

1980 е n Image pyramids (для смешивания и других задач) -> Gaussian pyramid. 1980 е n Image pyramids (для смешивания и других задач) -> Gaussian pyramid.

1980 е n Shape from X алгоритмы – восстановление формы из затенения, стерео изображений, 1980 е n Shape from X алгоритмы – восстановление формы из затенения, стерео изображений, текстуры.

n Edge and contour detection – обнаружение границ. n Edge and contour detection – обнаружение границ.

1990 е Продолжение исследований во всех ранее упомянутых направлениях n Улучшены Tracking (слежение за 1990 е Продолжение исследований во всех ранее упомянутых направлениях n Улучшены Tracking (слежение за объектом) алгоритмы n Использование множества стереоизображений для восстановления 3 дповерхности n

1990 е Использование статистических моделей. n Более плотное взаимодействие с компьютерной графикой (image-based modeling 1990 е Использование статистических моделей. n Более плотное взаимодействие с компьютерной графикой (image-based modeling and rendering). n

2000 е Работа с HDR-изображениями n Использование feature-based техник (иногда с обучением) для обнаружения 2000 е Работа с HDR-изображениями n Использование feature-based техник (иногда с обучением) для обнаружения объектов. n

Изображение n В рамках компьютерного зрения, как правило, может рассматриваться как дискретный двумерный массив Изображение n В рамках компьютерного зрения, как правило, может рассматриваться как дискретный двумерный массив значений I[r, c] яркости (интенсивности) света, отраженного либо прошедшего сквозь объекты.

Получение изображений Получение изображений

Получение изображений Получение изображений

Обработка изображений Обработка изображений

Возможные конфигурации ячеек камеры Возможные конфигурации ячеек камеры

Изображения Полутоновое изображение (чернобелое), каждому пикселю соответствует одно значение интенсивности n Бинарное изображение – Изображения Полутоновое изображение (чернобелое), каждому пикселю соответствует одно значение интенсивности n Бинарное изображение – каждому пикселю соответствует 0 или 1. n

Проблемы с изображениями n n n Разрешение и эффекты дискретизации Геометрические искажения Дисперсия (искажение Проблемы с изображениями n n n Разрешение и эффекты дискретизации Геометрические искажения Дисперсия (искажение из-за, например, водяных паров). Блюминг (избыточная яркость) Неоднородности матрицы Хроматическая дисторсия (показатель преломления линзы зависит от длины волны).

Форматы изображений Со сжатием (с потерями и без) n Без сжатия n Как правило, Форматы изображений Со сжатием (с потерями и без) n Без сжатия n Как правило, файл состоит из заголовка и собственно данных

Форматы изображений n Простейшие (PBM, PPM, PGM) Форматы изображений n Простейшие (PBM, PPM, PGM)

Форматы изображений n GIF (Graphics Interchange) – применялся для www, 256 цветный изначально. Форматы изображений n GIF (Graphics Interchange) – применялся для www, 256 цветный изначально.

Форматы изображений n TIFF (Tag Image File Format) – сжатие с потерями и без. Форматы изображений n TIFF (Tag Image File Format) – сжатие с потерями и без. Один из общепринятых издательских форматов.

Форматы изображений n JPEG – метод кодирования с потерями Форматы изображений n JPEG – метод кодирования с потерями

Групповое сжатие n Один из самых простых методов – группы одинаковых интенсивностей заменяются специальной Групповое сжатие n Один из самых простых методов – группы одинаковых интенсивностей заменяются специальной меткой.