Анализ данных
• Рядом с «анализом данных» встречаются слова «обнаружение знаний в базах данных» и «интеллектуальный анализ данных» . Их можно считать синонимами. Возникновение указанных терминов связано с новым витком в развитии средств и методов обработки данных.
• Цель анализа данных состоит в выявлении скрытых правил и закономерностей в наборах данных. • Современные технологии анализа данных перелопачивают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких-либо фрагментов неоднородных многомерных данных. • В отличие от оперативной аналитической обработки данных в Data Mining бремя формулировки гипотез и выявления необычных шаблонов переложено с человека на компьютер.
• Сфера применения Data Mining ничем не ограничена — она везде, где имеются какиелибо данные. Но в первую очередь методы Data Mining сегодня заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных. • Отдача от использования Data Mining может достигать1000%.
Некоторые бизнесприложения Data Mining • Розничная торговля анализ покупательской корзины (анализ сходства) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе. Знание покупательской корзины необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах.
• Страхование Выявление мошенничества. Страховые компании могут снизить уровень мошенничества, отыскивая определенные стереотипы в заявлениях о выплате страхового возмещения. Анализ риска. Проверка заявлений показала, что суммы, выплаченные по заявлениям людей, состоящих в браке, вдвое превышают суммы по заявлениям одиноких людей.
Классы систем интеллектуального анализа данных • Статистические пакеты. • Нейронные сети. • Деревья решений.