Скачать презентацию Анализ данных Осенний семестр 2014 Взаимосвязь переменных Скачать презентацию Анализ данных Осенний семестр 2014 Взаимосвязь переменных

R.pptx

  • Количество слайдов: 33

Анализ данных Осенний семестр 2014 Анализ данных Осенний семестр 2014

Взаимосвязь переменных Метрическая шкала Бинарная шкала Метрическая шкала Коэффициент корреляции Пирсона t-критерий Стьюдента Ранговая Взаимосвязь переменных Метрическая шкала Бинарная шкала Метрическая шкала Коэффициент корреляции Пирсона t-критерий Стьюдента Ранговая шкала (<30) Коэффициент корреляции Спирмена Критерий Манна. Уитни t-критерий Стьюдента Хи-квадрат 1 3 Хи-квадрат 4 3 Бинарная шкала Номинальная шкала (> двух уровней) ? ANOVA (дисперсионный анализ) 1 2

Корреляционный анализ Корреляционный анализ

Коэффициент корреляции Связь между двумя переменными Значения от -1 до 1 0 = отсутствие Коэффициент корреляции Связь между двумя переменными Значения от -1 до 1 0 = отсутствие линейной зависимости <0 – при увеличении одного значения другое уменьшается >0 – значения уменьшаются или увеличиваются одновременно чем дальше от 0, тем связь сильнее

Диаграммы рассеяния (1) Диаграммы рассеяния (1)

Диаграммы рассеяния (2) Диаграммы рассеяния (2)

Диаграммы рассеяния (3) Диаграммы рассеяния (3)

Диаграммы рассеяния (4) Диаграммы рассеяния (4)

Язык R Средства анализ данных Язык R Средства анализ данных

Что такое R Язык программирования для статистического анализа и визуализации его результатов Свободная программная Что такое R Язык программирования для статистического анализа и визуализации его результатов Свободная программная среда вычислений с открытым исходным кодом Официальный сайт проекта http: //www. r-project. org/

Язык R был создан сотрудниками Оклендского университета Россом Ихака и Робертом Джентельменом имеет двух Язык R был создан сотрудниками Оклендского университета Россом Ихака и Робертом Джентельменом имеет двух родителей: коммерческий язык программирования S/S-PLUS, из которого была позаимствована большая часть синтаксиса, и язык программирования Scheme, предоставивший многие семантические структуры возник в 1997 году и сразу стал пользоваться успехом у пользователей и разработчиков R. Ihaka R. Gentelman

Среда R доступна в бинарном виде для многих компьютерных платформ, в том числе Linux, Среда R доступна в бинарном виде для многих компьютерных платформ, в том числе Linux, Windows, Mac OS X и Mac OS Classic Предоставляется также исходный код для компиляции на других платформах

Интерфейс Используется интерфейс командной строки Интерфейс Используется интерфейс командной строки

Но… доступны и несколько графических интерфейсов пользователя, например пакет RCommander Но… доступны и несколько графических интерфейсов пользователя, например пакет RCommander

Импорт данных Импорт данных

Просмотр и редактирование Просмотр и редактирование

Анализ данных Анализ данных

Стандартные графики Стандартные графики

Окно скриптов Окно скриптов

Почему R? является свободным программным обеспечением поддерживает широкий спектр статистических и численных методов (классические Почему R? является свободным программным обеспечением поддерживает широкий спектр статистических и численных методов (классические статистические методы, линейные и нелинейные модели, методы классификации, кластеризации, анализ временных рядов…) хорошая расширяемость с помощью пакетов возможность создания качественной графики

Примеры Примеры

Примеры Примеры

Примеры Примеры

Модель данных R Базовым объектом данных в R является вектор > 1 [1] 1 Модель данных R Базовым объектом данных в R является вектор > 1 [1] 1 > # Сохраняем вектор > x <- c(168, 177, 178, 165, 170) > x # выводим вектор [1] 168 177 177 178 165 170 Работа с (многомерными) массивами, структурами данных, (разнородными) списками и матрицами Операции поэлементны

Доступ к элементу массива > z [, 1] [, 2] [, 3] [1, ] Доступ к элементу массива > z [, 1] [, 2] [, 3] [1, ] 19 22 25 [2, ] 20 23 26 [3, ] 21 24 27 > z[, 3] [1] 25 26 27 > z[1, 3] [1] 25

Управляющие структуры Условный оператор if (условие) {выполняется если условие верно} else {выполняется если условие Управляющие структуры Условный оператор if (условие) {выполняется если условие верно} else {выполняется если условие не верно} Циклы for (k in 1: 5){действие} while (условие){действие} Функции fname=function(a) {описание} Неявные циклы apply() может применить функцию к элементу матрицы или массиву

Элементы синтаксиса регистрозависимость <- присваивание, например: x<-7 # комментарий == равенство <=, >= сравнение Элементы синтаксиса регистрозависимость <- присваивание, например: x<-7 # комментарий == равенство <=, >= сравнение с равенством <> неравенство {} блок

Некоторые функции !!! help(function) # справка mean(x) # среднее min(x) # минимальное значение det(M) Некоторые функции !!! help(function) # справка mean(x) # среднее min(x) # минимальное значение det(M) # определитель матрицы inv(M) # обратная матрица plot(x, y) # график lm(y~x) # линейная регрессия …

Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения В базовую Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения В базовую поставку R включен основной набор пакетов, а всего по состоянию на 2012 год доступно более 4100 пакетов

Пример установки пакета Пакеты → Установить пакет(ы) Для R Commander ищем Rcmdr NB! для Пример установки пакета Пакеты → Установить пакет(ы) Для R Commander ищем Rcmdr NB! для запуска R Commander каждый раз необходимо включать этот пакет: Пакеты → Включить пакет… → Rcmdr

RStudio среда для работы с R подсветка кода работа с пакетами просмотр графиков удобная RStudio среда для работы с R подсветка кода работа с пакетами просмотр графиков удобная работа со скриптами …

Некоторые ссылки http: //www. ibm. com/developerworks/ru/library/l-r 1/ (Статистическое программирование на R: Часть 1. Купаемся Некоторые ссылки http: //www. ibm. com/developerworks/ru/library/l-r 1/ (Статистическое программирование на R: Часть 1. Купаемся в изобилии статистических возможностей) http: //www. r-project. org/ The R Project for Statistics http: //cran. r-project. org/doc/manuals/R-intro. pdf http: //ru. wikibooks. org/wiki/Язык_программирования_R http: //www. nytimes. com/2009/01/07/technology/business- computing/07 program. html? _r=0 (Data Analysts Captivated by R’s Power)

Вопросы? Вопросы?