Скачать презентацию НИЯУ МИФИ Деревья принятий решений Подготовили У 05 Скачать презентацию НИЯУ МИФИ Деревья принятий решений Подготовили У 05

Деревья принятий решений.pptx

  • Количество слайдов: 9

НИЯУ МИФИ Деревья принятий решений Подготовили У 05 -727: Комаров Станислав Мурашкин Дмитрий Сухорослова НИЯУ МИФИ Деревья принятий решений Подготовили У 05 -727: Комаров Станислав Мурашкин Дмитрий Сухорослова Юлия 2012

Суть метода ДЕРЕВО РЕШЕНИЙ — граф, схема, отражающая структуру задачи оптимизации многошагового процесса принятия Суть метода ДЕРЕВО РЕШЕНИЙ — граф, схема, отражающая структуру задачи оптимизации многошагового процесса принятия решений. Применяется в динамическом программировании и в других областях для анализа решений, структуризации проблем. Дерево решений применяется тогда, когда количество альтернатив и количество шагов принятия решений ограниченно (конечно).

Основные понятия Ветви дерева отображают различные события, которые могут иметь место, а узлы (вершины) Основные понятия Ветви дерева отображают различные события, которые могут иметь место, а узлы (вершины) — состояния, в которых возникает необходимость выбора. Причем узлы различны — в одних выбор из некоторого набора альтернатив осуществляет сам решающий (руководитель), в других узлах выбор от него не зависит. В таких случаях говорят, что выбор делает “природа”, а руководитель может только оценить вероятность того или иного ее “решения”.

 Прост в понимании и интерпретации. Не требует подготовки данных. Прочие техники требуют нормализации Прост в понимании и интерпретации. Не требует подготовки данных. Прочие техники требуют нормализации данных, а также удаления пропущенных данных. Способен работать, как с категориальными, так и с интервальными переменными. Прочие методы работают лишь с теми данными, где присутствует лишь один тип переменных. Например, метод отношений может быть применен только на номинальных переменных, а метод нейронных сетей только на переменных, измеренных по интервальной шкале. Использует модель «белого ящика» . Если определенная ситуация наблюдается в модели, то её можно объяснить при помощи булевой логики. Позволяет оценить модель при помощи статистических тестов. Это дает возможность оценить надежность модели. Является надежным методом. Метод хорошо работает даже в том случае, если были нарушены первоначальные предположения, включенные в модель. Позволяет работать с большим объемом информации без специальных подготовительных процедур. Данный метод не требует специального оборудования для работы с большими базами данных. Преимущества метода

 Проблема получения оптимального дерева решений является NP-полной с точки зрения некоторых аспектов оптимальности Проблема получения оптимального дерева решений является NP-полной с точки зрения некоторых аспектов оптимальности даже для простых задач. Таким образом, практическое применение алгоритма деревьев решений основано на эвристических алгоритмах, таких как алгоритм «жадности» , где единственно оптимальное решение выбирается локально в каждом узле. Такие алгоритмы не могут обеспечить оптимальность всего дерева в целом. Те, кто изучает метод дерева принятия решений, могут создавать слишком сложные конструкции, которые не достаточно полно представляют данные. Данная проблема называется проблемой «чрезмерной подгонки» Для того, чтобы избежать данной проблемы, необходимо использовать Метод «регулирования глубины дерева» . Существуют концепты, которые сложно понять из модели, так как модель описывает их сложным путем. Данное явление может быть вызвано проблемами XOR, четности или мультиплексарности. В этом случае мы имеем дело с непомерно большими деревьями. Существует несколько подходов решения данной проблемы, например, попытка изменить репрезентацию концепта в модели (составление новых суждений), или использование алгоритмов, которые более полно описывают и репрезентируют концепт (например, метод статистических отношений, индуктивная логика программирования). Для данных, которые включают категориальные переменные с большим набором уровней (закрытий), больший информационный вес присваивается тем атрибутам, которые имеют большее количество уровней. Недостатки метода

Пример использования Для финансирования проекта бизнесмену нужно занять сроком на один год 15000 ф. Пример использования Для финансирования проекта бизнесмену нужно занять сроком на один год 15000 ф. ст. Банк может одолжить ему эти деньги под 15% годовых или вложить в дело со 100%-ным возвратом суммы, но под 9% годовых. Из прошлого опыта банкиру известно, что 4% таких клиентов ссуду не возвращают. Что делать? Давать ему заем или нет?

Максимизируем ожидаемый в конце года чистый доход, который представляет собой разность суммы, полученной в Максимизируем ожидаемый в конце года чистый доход, который представляет собой разность суммы, полученной в конце года, и инвестированной в его начале. Таким образом, если заем был выдан и возвращен, то чистый доход составит: . Чистый доход = ((15000 + 15% от 15000) - 15000) = 2250 ф. ст. Возможные исходы Возможные решения Вероятность Выдавать заем Не выдавать (инвестировать) Клиент заем возвращает 2250 1350 0, 96 Клиент заем не возвращает -15000 1350 0, 04 1350 Ожидаемый чистый 1560 доход Решение 1 по таблице доходов

Решение 2 по дереву решений Ожидаемый чистый доход в кружках А и В вычисляется Решение 2 по дереву решений Ожидаемый чистый доход в кружках А и В вычисляется следующим образом: В кружке А: Е (давать заем) = {17250 х 0, 96 + 0 х 0, 04} - 15000 = = 16500 - 15000 = 1560 ф. ст. В кружке Б: Е (не давать заем) = {16350 х 1, 0 - 15000} = 1350 ф. ст. Поскольку ожидаемый чистый доход больше в кружке А, то принимаем решение выдать заем.

Задачи Посредническая фирма еженедельно закупает и распространяет химические реактивы для фотолабораторий. Стоимость закупки ящика Задачи Посредническая фирма еженедельно закупает и распространяет химические реактивы для фотолабораторий. Стоимость закупки ящика = 50 долларов, прибыль от продажи ящика - 80$. Статистика исследования спроса приведена в табл. 3. Таблица 3. Статистика недельного спроса на химреактивы. Если закупленный ящик остался непроданным, фирма несет убыток 50 долларов. Определить размер запаса, который целесообразно создать фирме. Изменится ли решение, если неудовлетворенный спрос клиента будет оценен (условно) в 45 долларов? Недельный спрос, ящиков Вероятность 11 0, 4 12 0, 4 13 0, 2