системный подход к анализу4 данных.ppt
- Количество слайдов: 31
STATISTICA Системный подход к анализу данных. Владимир Боровиков ® Stat. Soft Russia
План • STATISTICA. Структура. Возможности. Преимущества. • Модули STATISTICA. Типовые задачи, решаемые каждым модулем. • Этапы разведочного анализа медицинских данных.
STATISTICA 2000 Windows 95, 98, NT, 2000 Ready Полностью на русском языке Около 30 Mb на винчестере Существует Macintosh-версия Клиент-серверный интерфейс
Законченные решения от Stat. Soft База данных STATISTICA Результат, методика решения
Законченные решения от Stat. Soft Oracle SQL Access Excel Хранилище База данных Технологии • DDE • ODBC • Quick Import
Законченные решения от Stat. Soft Оценка репрезентативности выборки Верификация данных Агрегирование данных Визуализация Разведочный анализ STATISTICA Применение специальных методов Представление результатов
Наложение результатов на географическую карту Уникальный проект Stat. Soft
Http: //www. statsoft. ru Http: //www. statistica. ru
Структура пакета Основное окно Таблицы данных Графики Таблицы результатов
Импорт данных Прямое преобразование файлов из большинства популярных форматов: + Excel + Lotus (1 -2 -3, Symphony) + Quattro Pro + x. Base (DBase, Fox. Pro, Clipper) + Paradox + ASCII
Импорт данных Быстро и просто
Импорт данных Поддержка интерфейса открытых баз данных Microsoft ODBC: + MS Access + MS SQL Server + Oracle + Sybase + IBM DB 2/2, DB 2/6000 + сотни других популярных СУБД
Импорт данных Удобно
Подготовка данных Данные Стандартизация Подмножества Фильтрация Текстовые значения Формат Веса
Анализ данных STATISTICA включает все методы статистического анализа данных: от классических до самых современных Для удобства анализа методы разделены на модули
Анализ данных Основные статистики Нелинейное Множественная Временные ряды и и таблицы оценивание регрессия прогнозирование
Основные статистики и таблицы • Средний возраст пациентов • Интервал, в котором содержится не менее 68% всех значений веса • Отличается ли вероятность встретить татуировку на теле трупа женщины от вероятности встретить татуировку на теле трупа мужчины • На сколько изменился средний вес пациентов после проведенного лечения
Основные статистики и таблицы • Степень влияния вакцинации на вероятность перенести заболевание в разгар эпидемии • Влияет ли нифедипин на диаметр коронарных артерий • Влияет ли пассивное курение на функцию легких
Основные статистики и таблицы • Исчерпывающий набор описательных статистик • Многообразие таблиц классификации • Корреляции • t-критерии для зависимых и независимых выборок • Однофакторный дисперсионный анализ • Вероятностный калькулятор
Множественная регрессия • Из выборки вывести уравнение зависимости веса человека Y от его роста X вида Y=AX+B • Обобщение: вывести уравнение вида Y=A 1 X 1+A 2 X 2+A 3 X 3+…+Ak. Xk
Нелинейное оценивание
Временные ряды
Временные ряды • Сезонное ежедневное влияние на число рождений в Израиле (Armitage Peter (1985) Biometry and medical statistics, Biometrics, 41, № 4, 823 -833. ) • Математическая модель травматизма на производстве. Построение прогноза травматизма (М. М. Шварцман, Ростов на Дону)
Кластерный анализ • Больной описывается 10 -ю признаками: – Рост, Вес, Возраст, Температура, Специальные показатели. • Цель - разбить всех больных на группы максимально схожих между собой.
Анализ данных • • Power Analysis Анализ выживаемости Непараметрическая статистика Нейронные сети
Интерактивный анализ Весь анализ в системе проводится с использованием наглядных диалоговых окон, следующих типовым сценариям обработки данных. Стартовая панель Выбор метода Группировка переменных Выбор Окно переменных результатов
STATISTICA BASIC Программирование на STATISTICA BASIC
Графики
Работа с графикой 3 D-вращение и перспектива
Работа с графикой Дальнейшая настройка
7 достоинств системы • Знакомый Windows-интерфейс • Русский язык • Полный набор статистических методов • Сотни типов графиков • Облегчающие работу программы-мастера • Объекты и соответствующие им операции • Настройка аналитической среды в соответствии с пожеланиями пользователей
системный подход к анализу4 данных.ppt