PYTHON & R ОСНОВНІ ВІДОМОСТІ. ТИПИ ДАНИХ
Типи даних у Python та R
PYTHON Виклик довідки: help(math. sin) Коментарі a=2+5 #це коментар в Python, Ви можете писати все, що завгодно Бібліотеки from __ import __ from pylab import *
PYTHON Змінні a=12 b=’school’ c=1. 34 Масиви (Списки) num. List=[1, 3, 4, 6] str. List=[‘Barca’, ‘Chelsea’, ‘Dnipro’] bool. List=[True, False] Кортежі tup 1 = ('physics', 'chemistry', 1997, 2000); Словники dict = {'Name': 'Zara', 'Age': 7, 'Class': 'First'}; print "dict['Name']: ", dict['Name']; print "dict['Age']: ", dict['Age']; Матриці (списки списків) from numpy import * a = np. matrix('1 2; 3 4') print a
PYTHON Доступ до даних масиву (починається із 0): print num. List[1: 3] my. Var=str. List[0] Вибірки з масивів (Slicing): num. List[1: 3] #Index 1 through index 3. num. List[2: -1] #Index 2 through index one from last. num. List[: 2] #Start through index 2. num. List[2: ] #Index 2 through end. num. List[: : 2] #Start through end, skipping ahead 2 places each time.
PYTHON Прочитати з дані з csv-файла: import numpy a=numpy. loadtxt("d: /cbs/ddt. csv", delimeter=", ") Записати дані в csv-файл: numpy. savetxt("d: /cbs/exp. txt", delimeter=", ")
R Виклик довідки: help(math. sin) Коментарі a=2+5 #це коментар в R, Ви можете писати все, що завгодно Бібліотеки library(datasets)
R Змінні a=12 b=’school’ c=1. 34 Масиви int. Vector<-c(1, 3, 4, 6) str. Vector <- c(“you”, “me”, “friendship”) bool. Vector <- c(TRUE, FALSE, F, T) Фактори factor(c("yes", "no", "yes", "maybe", "no", "maybe", "no")) ordered(as. factor(c("First", "Third", "Second", "Fifth", "First", "Thi rd")), levels=c("First", "Second", "Third", "Fourth", "Fifth")) Матриці X<-matrix(data = 1: 15, nrow = 5, ncol = 5, byrow = T) t(X)
R Списки x <- c(1: 4) y <- FALSE z <- matrix(c(1: 4), nrow=2, ncol=2) my. List <- list(x, y, z) my. List Датафрейми: v 1 = 1: 5 v 2 = c(T, T, F, F, T) df = data. frame(v 1, v 2) print(df) Доступ до даних датафрейма: df[, 1] df$v 2
R Доступ до даних масиву (починається із 1): int. Vector[3] str. Vector[1: 2] Вибірки з масивів (Slicing): num. List[1: 3] #Index 1 through index 3. num. List[2: ] #Index 2 through end. num. List[: : 2] #Start through end, skipping ahead 2 places each time.
R Записати дані вектору у файл - write. table Зчитати дані з файлу: read. csv, read. table write. table(X, file="d: /Myfile. csv", sep=", ", row. names=T) my. X<-read. csv(file="d: /Myfile. csv", header = TRUE, sep = ", ")
Завдання 1 (зробити на R та Python) 1. Зчитати дані з файлу «d: /bcs/expdata. csv» 2. Записати в окрему змінну перший стовпчик 3. Обрати в окрему змінну всі непарні елементи стовпчика 4. Обрати в окрему змінну всі парні елементи стовпчика 5. Зробити з двох окремих змінних з парними і непарними елементами спільну матрицю 6. Записати отриману матрицю у файл
ФУНКЦІЇ ТА БІБЛІОТЕКИ
PYTHON Математичні фукнції abs(x) #absolute value sqrt(x) #square root ceiling(x) #ceiling(3. 475) is 4 floor(x) #floor(3. 475) is 3 trunc(x) #trunc(5. 99) is 5 round(x, digits=n) #round(3. 475, digits=2) is 3. 48 cos(x), sin(x), tan(x) #also acos(x), cosh(x), acosh(x), etc. log(x) #natural logarithm log 10(x) #common logarithm exp(x) #e^x
PYTHON Математичні фукнції math. ceil(x) math. fabs(x) math. factorial(x) math. floor(x) math. exp(x) math. sqrt(x) math. acos(x) math. cos(x)
PYTHON Строкові фукнції astring = “Hello world!“ len(astring) astring[3: 7] astring. upper() astring. lower() astring. split(" ")
PYTHON бібліотеки Num. Py Scy. Py Matplotlib Pandas Seaborn
PYTHON Задати функцію: def function_name(parameters): # Виконання певних дій Приклад: def add_two(a, b): c = a + b return c Або без використання змінної c def add_two(a, b): return a + b Використання: My. Sum=add_two(14, 45)
PYTHON Задати функцію з параметрами по замовчуванню: def function_name(parameters, named_default_parameter=value): # Виконання певних дій def shout(exclamation="Hey!"): print exclamation shout() # Displays "Hey!" shout("Watch Out!") # Displays "Watch Out!"
R Математичні фукнції abs(x) #absolute value sqrt(x) #square root ceiling(x) #ceiling(3. 475) is 4 floor(x) #floor(3. 475) is 3 trunc(x) #trunc(5. 99) is 5 round(x, digits=n) #round(3. 475, digits=2) is 3. 48 cos(x), sin(x), tan(x) #also acos(x), cosh(x), acosh(x), etc. log(x) #natural logarithm log 10(x) #common logarithm exp(x) #e^x
R Строкові фукнції substr(x, start=n 1, stop=n 2) #Extract or replace substrings in a character vector. x <- "abcdef" substr(x, 2, 4) #is "bcd" sub(pattern, replacement, x, ignore. case =FALSE, fixed=FALSE) #Find pattern in x and replace with replacement text. If fixed=FALSE then #pattern is a regular expression. #If fixed = T then pattern is a text string. sub("\s", "Hello There") returns "Hello. There" strsplit(x, split) #Split the elements of character vector x at split. strsplit("abc", "") #returns 3 element vector "a", "b", "c" toupper(x) #Uppercase tolower(x) #Lowercase
R Згенерувати матрицю: replicate(10, rnorm(20)) Визначити параметри матриці: dim(A) конкатенація матриць: rbind (A, B) #вертикальна cbind(A, B) #горизонтальна вибір з матриці чи датафрейма даних, що відповідають умові: subset(airquality, Day == 1, select = -Temp)
R Задати функцію: function(аргумент1, аргумент2, . . . ) {список дій} #Fahrenheit to Celsius: ftoc <- function(f){ c <- (f - 32 ) * 5 / 9 c} #Вызов функции ftoc(0)
R Бібліотеки в R: boot #bootstrap datasets foreign #other formats lattice nnet stats de. Solve e 1071 tseries stringr wavelet
Завдання 2 (зробити на R або Python) 1. Зчитати дані з файлу «d: /bcs/expdata. csv» 2. Записати в окрему змінну перший стовпчик 3. Визначити кількість елементів в цій змінній 4. Створити випадковий набір даних за вказаним розподілом, помістити його у окрему змінну. 5. З’єднати разом дві перший стовпчик і другий.