R Programlama Dilini Öğreniyorum

R programlama dilini öğreniyorum. Data science ve istatistik için python ya da R dillerinden birini seçebilirdim. Şimdilik hedefim için R dilinin daha uygun olduğuna karar verip öğrenmek için çeşitli platformları ve içeriklerini bir hayli inceledim. DataCamp, Data Quest, Codecademy gibi çeşitli online platformları denedim bu inceleme sürecinde. Her birini farklı farklı alanlar için gayet iyi buldum. R programlama için her platformun çeşitli faydalı ve öğretici kursları var, ilgilenenlere bir bakmalarını tavsiye ederim.

Şu an R programlama dilini öğrenmek için DataCamp‘in 18 saatlik R Programming kursunu alıyorum. R programlama yeni öğrendiğim bir dil olduğu için notlar alarak ilerliyorum. Kursta ilerledikçe aldığım bazı notları burada da paylaşıyor olacağım. R Programming kursunu bitirdikten sonra Data Analyst with R career track ile devam etmeyi planlıyorum.  Covid-19 nedeniyle evde kaldığım süreci kendimi geliştirebileceğim bu tür işlerle değerlendirmiş olmak beni bu zamanlar için motive eden şeylerden biri oldu.

Bu benim genel anlamdaki ilk kodlama deneyimim değil fakat R programlama dilini ilk defa öğrenmeye başladım. Python programlama diline de önceden biraz baktığım için başlangıç anlamında R ile benzer bir dil olduğunu söyleyebilirim. Daha önceden Web programlama ile ilgilendiğim için HTML, CSS, JavaScript öğrenme aşamalarım olmuştu. Web tasarım anlamında kendi sitemin tasarımında daha özgür olmamı sağladığı için bu dilleri kullanmayı da çok seviyorum.

R programlama için aldığım kurs tamamen İngilizce olduğu için notlarım da İngilizce olacak.

Ve şimdi 4 saatlik ilk bölümün notlarına geçiyorum.

Introduction to R

  • The # sign is to add comments
  • Addition: +
  • Subtraction: –
  • Multiplication: *
  • Division: /
  • Exponentiation: ^
  • Modulo: %%
  • The ^ operator raises the number to its left to the power of the number to its right.
  • The modulo returns the remainder of the division of the number to the left by the number on its right.

Variables and vectors;

  • A basic concept in (statistical) programming is called a variable that allows you to store a value.
  • Decimal values like 5.6 are called numerics.
  • Natural numbers like 7 are called integers. Integers are also numerics.
  • Boolean values (TRUE or FALSE) are called logical.
  • Text (or string) values are called characters.
  • class()function is used for checking the data type of a variable.
  • Vectors are one-dimension arrays that can hold numeric data, character data, or logical data. A vector is a simple tool to store data.
  • The combine function c() where the vector elements are placed and separated by a comma between the parentheses. e.g. numeric_vector <- c(1, 2, 3).
  • To give a name to the elements of a vector, use the names() function.
  • sum() calculates the sum of all elements of a vector.
  • To select elements of a vector, square brackets are used. Between the square brackets, you indicate what elements to select. To select the first element of the vector, type vector[1]. To select the second element of the vector, you type vector[2].
  • To select multiple elements from a vector, you can add square brackets at the end of it, vector[c(1, 5)].
  • Calculate the average of the elements in vector, mean(vector).

Comparison operators;

  • < for less than
  • > for greater than
  • <= for less than or equal to
  • >= for greater than or equal to
  • == for equal to each other
  • != not equal to each other
  • selection_vector only selects the elements that correspond to TRUE .

Matrix;

  • A matrix is a collection of elements of the same data type (numeric, character, or logical) arranged into a fixed number of rows and columns. A matrix is called two-dimensional.
  • Construct a matrix in R with the matrix() function.
  • matrix(1:9, byrow = TRUE, nrow = 3)
  • rownames(matrix) <- row_names_vector
  • colnames(matrix) <- col_names_vector
  • rowSums() function  calculates the totals for each row of a matrix.
  • colSums() function  calculates the totals for each column of a matrix.
  • To add a column or multiple columns to a matrix with the cbind() function, which merges matrices and/or vectors together by column. Combine R objects by rows with the  rbind(). E.g; matrix <- cbind(matrix1, matrix2, vector1 …)
  • my_matrix[1,2] selects the element at the first row and second column.
  • my_matrix[1:3,2:4] results in a matrix with the data on the rows 1, 2, 3 and columns 2, 3, 4.
  • my_matrix[,1] selects all elements of the first column.
  • my_matrix[1,] selects all elements of the first row.
  • 2 * my_matrixmultiplies each element of my_matrix by two.

Factors;

  • The term factor refers to a statistical data type used to store categorical variables.
  • To create factors, use of the function factor().
  • To change the names of levels with the function levels() .
  • summary() will give a quick overview of the contents of a variable.

Data frames;

  • A data frame has the variables of a data set as columns and the observations as rows.
  • The function head()enables you to show the first observations of a data frame. Similarly, the function tail() prints out the last observations in your data set.
  • The function str() shows you the structure of your data set.
  • The function frame() creates data frames, tightly coupled collections of variables which share many of the properties of matrices and of lists, used as the fundamental data structure by most of R’s modeling software.
  • my_df[1,2] selects the value at the first row and second column in my_df.
  • my_df[1:3,2:4] selects rows 1, 2, 3 and columns 2, 3, 4 in my_df.
  • planets_df[,3],  planets_df[,”diameter”], and planets_df$diameter work the same way.
  • The first argument of subset() specifies the data set for which you want a subset. E.g. subset(my_df, subset = some_condition).
  • order() is a function that gives you the ranked position of each element when it is applied on a variable.
  • Vectors (one dimensional array): can hold numeric, character or logical values. The elements in a vector all have the same data type.
  • Matrices (two dimensional array): can hold numeric, character or logical values. The elements in a matrix all have the same data type.
  • Data frames (two-dimensional objects): can hold numeric, character or logical values. Within a column all elements have the same data type, but different columns can be of different data type.

Lists;

  • A list in R allows you to gather a variety of objects under one name in an ordered way.
  • To construct a list, use the function list().
  • To select elements from list use[[ ]] or the $  e.g. the_list[[“elements”]] and the_list$elements.

R programlama

Bir yorum ekleyin

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir