R.pptx
- Количество слайдов: 33
Анализ данных Осенний семестр 2014
Взаимосвязь переменных Метрическая шкала Бинарная шкала Метрическая шкала Коэффициент корреляции Пирсона t-критерий Стьюдента Ранговая шкала (<30) Коэффициент корреляции Спирмена Критерий Манна. Уитни t-критерий Стьюдента Хи-квадрат 1 3 Хи-квадрат 4 3 Бинарная шкала Номинальная шкала (> двух уровней) ? ANOVA (дисперсионный анализ) 1 2
Корреляционный анализ
Коэффициент корреляции Связь между двумя переменными Значения от -1 до 1 0 = отсутствие линейной зависимости <0 – при увеличении одного значения другое уменьшается >0 – значения уменьшаются или увеличиваются одновременно чем дальше от 0, тем связь сильнее
Диаграммы рассеяния (1)
Диаграммы рассеяния (2)
Диаграммы рассеяния (3)
Диаграммы рассеяния (4)
Язык R Средства анализ данных
Что такое R Язык программирования для статистического анализа и визуализации его результатов Свободная программная среда вычислений с открытым исходным кодом Официальный сайт проекта http: //www. r-project. org/
Язык R был создан сотрудниками Оклендского университета Россом Ихака и Робертом Джентельменом имеет двух родителей: коммерческий язык программирования S/S-PLUS, из которого была позаимствована большая часть синтаксиса, и язык программирования Scheme, предоставивший многие семантические структуры возник в 1997 году и сразу стал пользоваться успехом у пользователей и разработчиков R. Ihaka R. Gentelman
Среда R доступна в бинарном виде для многих компьютерных платформ, в том числе Linux, Windows, Mac OS X и Mac OS Classic Предоставляется также исходный код для компиляции на других платформах
Интерфейс Используется интерфейс командной строки
Но… доступны и несколько графических интерфейсов пользователя, например пакет RCommander
Импорт данных
Просмотр и редактирование
Анализ данных
Стандартные графики
Окно скриптов
Почему R? является свободным программным обеспечением поддерживает широкий спектр статистических и численных методов (классические статистические методы, линейные и нелинейные модели, методы классификации, кластеризации, анализ временных рядов…) хорошая расширяемость с помощью пакетов возможность создания качественной графики
Примеры
Примеры
Примеры
Модель данных R Базовым объектом данных в R является вектор > 1 [1] 1 > # Сохраняем вектор > x <- c(168, 177, 178, 165, 170) > x # выводим вектор [1] 168 177 177 178 165 170 Работа с (многомерными) массивами, структурами данных, (разнородными) списками и матрицами Операции поэлементны
Доступ к элементу массива > z [, 1] [, 2] [, 3] [1, ] 19 22 25 [2, ] 20 23 26 [3, ] 21 24 27 > z[, 3] [1] 25 26 27 > z[1, 3] [1] 25
Управляющие структуры Условный оператор if (условие) {выполняется если условие верно} else {выполняется если условие не верно} Циклы for (k in 1: 5){действие} while (условие){действие} Функции fname=function(a) {описание} Неявные циклы apply() может применить функцию к элементу матрицы или массиву
Элементы синтаксиса регистрозависимость <- присваивание, например: x<-7 # комментарий == равенство <=, >= сравнение с равенством <> неравенство {} блок
Некоторые функции !!! help(function) # справка mean(x) # среднее min(x) # минимальное значение det(M) # определитель матрицы inv(M) # обратная матрица plot(x, y) # график lm(y~x) # линейная регрессия …
Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения В базовую поставку R включен основной набор пакетов, а всего по состоянию на 2012 год доступно более 4100 пакетов
Пример установки пакета Пакеты → Установить пакет(ы) Для R Commander ищем Rcmdr NB! для запуска R Commander каждый раз необходимо включать этот пакет: Пакеты → Включить пакет… → Rcmdr
RStudio среда для работы с R подсветка кода работа с пакетами просмотр графиков удобная работа со скриптами …
Некоторые ссылки http: //www. ibm. com/developerworks/ru/library/l-r 1/ (Статистическое программирование на R: Часть 1. Купаемся в изобилии статистических возможностей) http: //www. r-project. org/ The R Project for Statistics http: //cran. r-project. org/doc/manuals/R-intro. pdf http: //ru. wikibooks. org/wiki/Язык_программирования_R http: //www. nytimes. com/2009/01/07/technology/business- computing/07 program. html? _r=0 (Data Analysts Captivated by R’s Power)
Вопросы?