
a5f4cdeab85e3acd016776075363de52.ppt
- Количество слайдов: 22
Морфологическое сравнение по форме на основе скелетных представлений
Скелетные представления бинарных фигур. Основные определения. Пространство изображения : множество P точек плоскости, P X Y, где X, Y – оси прямоугольной декартовой системы координат. Бинарная фигура (паттерн) – множество точек B = {p P: p=
Скелет фигуры -множество центров ее максимальных составляющих элементов S(A) = {p: G(p, r) A, ! q P, t R, G(p, r) G(q, t) A}. Радиальной или дистанционной функцией образа A назовем скалярную функцию r. A(p) = max r R {r: G(p, r) A} (1) Это позволяет определить скелетное представление как множество пар SR(A) = {
: p S(A)}. Такое описание содержит всю информацию о форме фигуры, необходимую для реконструкции: A =
SR(A) {G(p, r)}.
Скелетное описание формы и морфологическое сравнение по форме Пусть дан образ B и требуется сравнить его форму с формой образа A. При помощи радиальной функции можно определить морфологическую проекцию бинарного образа B на форму образа A: Pr(B, A) = p S(A) { G(p, r. B(p)) }. (2) Для морфологических проекций, определяемых выражением Pr(B, A) = p S(A) { G(p, r. B(p)) }. справедливы следующие основные свойства: 1) Pr(Pr(B, A) = Pr(B, A) 2) Pr(A, A) = p S(A) { G(p, d. B(A)) } = A 3) Pr(B, A) B 4) С B Pr(С, A) Pr(B, A) (3) Из выражения (3) следует, что || Pr(B, A) || B ||, и это позволяет определить нормированный на отрезке [0, 1] морфологический коэффициент корреляции (МКК) Пытьева: KM(B, A) = || Pr(B, A) || / || B || (4) Назовем (модельным) множеством фигур формы A множество фигур, инвариантных к проецированию на форму A: MA = {B P: Pr(B, A) = B}.
Морфологический коэффициент корреляции Пытьева оценивает степень близости фигуры B к модельному множеству фигуры A, причем KM(B, A) = 1 B MA Иными словами, МКК оценивает степень сходства формы фигуры B с формой фигуры A. Рис. 1. Примеры проекции фигуры на форму Рис. 1 иллюстрирует идею построения морфологической проекции бинарной фигуры на форму другой бинарной фигуры. Зеленым показан контур эталонной фигуры, красным – проецируемой. Скелет (зеленые линии на рисунке) построен на основе дискового структурирующего элемента. Таким образом, аппарат Пытьевского морфологического сравнения по форме оказывается полностью распространен на случай бинарных монотонных морфологий.
Морфологическое проецирование в непрерывной бинарной морфологии. Основные определения. Жордановой кривой называется непрерывный инъективный образ окружности при отображении его в евклидову плоскость P=R 2. Здесь R – множество действительных чисел. Важно, что жорданова кривая не имеет самопересечений. Фигурой называется связная замкнутая область плоскости, ограниченная конечным числом непересекающихся жордановых кривых. P – евклидова плоскость с соответствующим расстоянием d(p, q), p, q P. Граница фигуры A определяется как множество точек A = {p: p P, r>0, D(p, r) A , D(p, r) AC }, где AC = P A – дополнение или фон фигуры A; D(p, r) – открытый круг радиуса r с центром в точке p, определяемый выражением D(p, r) = {q: q P, d(p, q) < r R}. Пустым или вписанным кругом фигуры A называется круг D(p, r) A. Максимальным пустым кругом называется пустой круг, который не содержится целиком ни в одном другом пустом круге данной фигуры.
Скелетом S(A) фигуры A называется множество центров всех ее максимальных пустых кругов. отрезок параболы Контур фигуры Скелет фигуры отрезок прямой Рис. 2. Скелет фигуры Радиальной или дистанционной функцией точки p P для фигуры A называется максимальная величина Радиуса пустого круга с центром в данной точке: r. A(p) = { - : p AC; 0: p A; argmaxr R {||D(p, r)||: D(p, r) A}: p A}. Реконструкция фигуры по скелетному представлению в точности совпадает с фигурой SR(A) =
SR(A) {D(p, r)} = A. Скелеты фигур являются в данном случае непрерывными связными планарными графами. Более того, для фигур, ограниченных многоугольниками с конечным числом сторон, скелет оказывается состоящим из конечного числа отрезков аналитических кривых всего двух видов: прямых и парабол.
Классическая и Обобщенная диаграммы Вороного. Классическая: Ti = {p: p P, pi A, pj pi, d(pi, p) < d(pj, p)}, Ti - ячейка диаграммы Вороного (множество точек), каждая из которых содержит все точки плоскости, для которых ближайшей точкой множества A в смысле заданной метрики d является одна и та же точка p. Точка pi - центр притяжения или сайт для ячейки Ti Обобщенная: pi – сайт-точка или сайт-сегмент для ячейки Ti В обобщенной диаграмме Вороного в качестве сайтов (центров притяжения) могут рассматриваться не только отдельные точки, но и фигуры (множества точек), например, непрерывные сегменты линий границы. В частности граница многоугольной фигуры представляется в виде (циклически) упорядоченного множества сайтов двух типов: сайтов-точек и сайтов-сегментов. T 2 T 1 T 5 T 0 T 3 T 4 T 6 T 9 T 8 T 3 T 7 T 0 T 11 T 10 Классическая диаграмма Вороного T 2 T 4 T 1 Рис. 3 Обобщенная диаграмма Вороного
Сайт-точка и сайт-сегмент, имеющие непустое пересечение, называются соседними сайтами. Сайт-точка считается ближайшим сайтом для некоторой точки p, если он является ближайшей точкой границы A к данной точке p. Сайт-сегмент считается ближайшим сайтом для некоторой точки p, если он включает ближайшую точку границы A к данной точке p, причем эта ближайшая точка является ортогональной проекцией точки p на прямую, содержащую данный сайт. Ячейкой Вороного для данного сайта границы является множество точек плоскости, для которых данный сайт является ближайшим. Сайты называются смежными, если их ячейки Вороного имеют общую невырожденную границу (более одной общей точки). Бисектором пары сайтов называется линия, являющаяся общей границей ячеек двух смежных сайтов. Диаграммой Вороного V(A) многоугольной фигуры A называется объединение бисекторов всех ее сайтов. Скелет многоугольной фигуры является подмножеством диаграммы Вороного этой фигуры: S(A) V(A). В непрерывном случае скелет фигуры можно определить как множество точек сингулярности (разрыва непрерывности производной) дистанционной функции r. A(p). Функция r. A(p) непрерывна внутри ячеек диаграммы Вороного и внутри их однозначно описывается уравнениями наклонных плоскостей (для сегментов) и конусов (для точек). Диаграмма Вороного многоугольной фигуры V(A) кусочно-гладкая дистанционная функция r. A(p).
Вычисление морфологической проекции. Постановка задачи. A и B - бинарных фигуры. Морфологическую проекцию фигуры B на форму фигуры A можно определить выражением Pr(B, A) = p S(A) { D(p, r. B(p)) }. Радиальная функция в произвольных точках может принимать и отрицательные значения (если эти точки не принадлежат фигуре B), и в этом случае D(p, r) = . Т. к. форма функции r. B(p) никак не связана с формой скелета S(A), возможно существование таких точек p, q S(A), для которых D(q, r. B(q)) D(p, r. B(p)). Такие пары точек удовлетворяют простому геометрическому условию D(q, r. B(q)) D(p, r. B(p)) d(p, q) < r. B(p) – r. B(q). Тогда минимальный дескриптор формы проекции имеет следующий вид: Pr(B, A) = p S(A) {D(p, r. B(p)): r. B(p)>0, q S(A), d(p, q)>r. B(p)-r. B(q)}. (5)
Алгоритм вычисления морфологической проекции 1) Построить диаграмму Вороного V(A) и скелет S(A) фигуры А. 2) Построить диаграмму Вороного V(B) фигуры В. 3) Определить отрезки пересечения скелета S(A) с ячейками диаграммы Вороного V(B). 4) Вычислить значения функции r. B(p) для полученных отрезков скелета S(A). 5) Реконструировать Pr(B, A) согласно Pr(B, A) = p S(A) {D(p, r. B(p)): r. B(p)>0, q S(A), d(p, q)>r. B(p)-r. B(q)}. Данный алгоритм обладает достаточной вычислительной эффективностью для того, чтобы быть применимым на практике.
S(A) V(B) B PR(B, A) A Пример вычисления проекции PR(B, A)
S(A) V(B) B PR(B, A) A Пример вычисления проекции PR(B, A)
S(A) V(B) B PR(B, A) A Пример вычисления проекции PR(B, A)
Сравнение по форме скелетных описаний Поскольку || Pr(B, A) || B ||, это позволяет определить нормированный на отрезке [0, 1] морфологический коэффициент корреляции (МКК) Пытьева: KM(B, A) = || Pr(B, A) || / || B || Назовем (модельным) множеством фигур формы A множество фигур, инвариантных к проецированию на форму A: MA = {B P: Pr(B, A) = B}.
Сравнение по форме на основе скелетных описаний со связями Свободной морфологической моделью описание формы фигуры вида: M(A, ) = p S(A) {G(p, (p)) }, (p) M(A, ) = {M(A, ), } – модельное множество С учетом этого, морфологическая проекция является решением оптимизационной задачи Pr(B, A) = arg max U M(A, ){||U||: U B} (6) Т. к. M(A, ) B (p) r. B(p), то Pr(B, A) = M(A, B), B(p) = arg max (p) {||M(A, )||: (p) r. B(p), p S(A)} (7) Рассмотрим следующее достаточно сильное, но интуитивно приемлемое допущение. Если в исходном скелетном представлении значения радиальной функции двух точек совпадают (то есть толщина фигуры в этих точках одинакова), то и в проекции они должны совпадать: p, q S(A): r. A(p) = r. A(q) B(p) = B(q). То всегда существует функциональная зависимость: (p) = f(r. A(p) (8) Если f F, где F – некоторый заданный класс функций. Тогда класс функций в задаче (7) однозначно определяется как (A, F).
Модель “Расширение/Сжатие” Модель расширение/сжатие – расширение/сжатие фигуры путем добавления произвольной константы к радиальной функции: f(t) = t + b, B(p) = r. A(p) + b. B, b. B = min p S(A) { r. B(p) – r. A(p) }. (9) В случае непрерывной морфологии с круглым структурирующим элементом легко показать, что добавление положительной константы b ко всем значениям радиальной функции исходного скелета реализует функцию расширения (дилатации) Серра исходной фигуры дисковым структурирующим элементом радиуса b: p S(A) {D(p, r. A(p) + b)}= p A D(p, b) = A D(b). Добавление к значениям радиальной функции отрицательной константы b реализует в форме (9) функцию сжатия (эрозии) Серра с дисковым элементом радиуса b: p S(A){D(p, r. A(p) – b)} = {p: D(p, b) A} = A D(b). Универсальное обозначение A b = { A D(b): b 0; A D(-b): b<0}. (10) То множество фигур «одной формы» имеет вид M(A, b) = {A b, b R}, а решение задачи (7) с учетом (10) записывается как Pr(B, M(A, b)) = A b. B, b. B = arg maxb R {||A b||: (A b) B}
Проекция на класс форм «расширение/сжатие»
Модель “Утончения/Утолщения” Модель утончения/утолщения – утончение/утолщение фигуры путем умножения произвольной константы на радиальную функцию: f(t) = at, B(p) = a. B r. A(p), a. B = min p S(A) { r. B(p) / r. A(p) } При a>1 происходит утолщение фигуры, При a<1 – ее утончение. Выбор a<0 приводит к M(A, )=. A a = p S(A) {D(p, ar. A(p))} – операция утончения/утолщения Тогда решение задачи (7) будет иметь вид: Pr(B, M(A, a)) = A a. B, a. B = arg maxa R {||A a||: (A a) B}.
Проекция на класс форм «утончение/утолщение»
Сравнение по форме инвариантное к сдвигу изображения Все до сих пор введенные операторы проецирования фигуры на форму другой фигуры не были инвариантны к смещению проецируемой фигуры относительно эталона формы. Однако на базе неинвариантных операторов легко могут быть определены вторичные инвариантные операторы. Пусть имеется модельное множество M(A, ) и определен соответствующий оператор проекции Pr(B, M(A, )). Тогда инвариантный к сдвигу проектор на форму может быть определен как оператор, выбирающий максимальный по норме вписанный образ в заданном модельном классе: PR(B, M(A, )) = argmax p P ||Pr(B, M(A(p), ))||. Рис. 4. Инвариантные проекции на разные классы форм Слева – инвариантная проекция прямоугольника на свободную форму, задаваемую треугольником. В центре – инвариантная проекция на класс форм «расширение/сжатие» . Справа – инвариантная проекция на класс форм «утончение/утолщение» .
Заключение. C алгоритмической точки зрения многие описанные процедуры морфологического проецирования фигур можно отнести к классу «гистограммных» , поскольку они основаны на анализе эмпирической функции распределения расстояний от точек скелета фигуры A до точек границы фигуры B. Такую функцию вида h. BA(r) = min p S(A) {r. B(p): r. A(p) = r}, (11) определенную на множестве R = p S(A) r. A(p), можно назвать проекционной гистограммой пары фигур . В этой гистограмме содержится вся необходимая информация для формирования закона отображения (look-up-function) f (8) для любого заданного класса функций F. Помимо глобальных ограничений вида (p) = f(r. A(p)), вычислимых на основе гистограммы, можно также рассматривать и локальные ограничения различного вида, накладываемые на соотношения значений радиальной функции лишь на отдельных соседних ребрах скелета. Каждое ограничение такого рода, очевидно, определяет собственную специфическую морфологическую систему