Επεξεργασία δεδομένων με τη γλώσσα προγραμματισμού R

Εισαγωγή στη γλώσσα προγραμματισμού R για την επεξεργασία δεδομένων.

Εγκατάσταση εργαλείων για την ενότητα αυτή:

(δωρεάν εγκατάσταση από εδώ)

"RStudio Desktop"  (δωρεάν εγκατάσταση από εδώ)

Διαφάνειες Διαλέξεων

6.R-ProgrammingLanguage-Introduction-DataTypes.pdf

Σημειώσεις Εργαστηρίου

Εργαστηριακή Άσκηση 5.pdf
ΕΡΓΑΣΤΗΡΙΟ 5: R - Βασικοί τύποι μεταβλητών, διανύσματα, μητρώα
Εργαστηριακή Άσκηση 6.pdf
ΕΡΓΑΣΤΗΡΙΟ 6: R-Πλαίσια δεδομένων (dataframe)

Υποχρεωτική Εργασία 2

2hErgasia-R_2024-2025.zip
Τελική Υποχρεωτική Εργασία 2, ΑΕ 2024-2025
Διάβασμα αρχείου CSV με την R

Κώδικας Εργαστηρίου Ακαδημαϊκού έτους 2024-2025

# Team 007
# go to data folder
# change back slash to slash
setwd("C:/Users/user/Documents/666666/2hErgasia-R_2024-2025 (4)")
data=read.csv('GreekCensus2021.csv',header=TRUE,sep=';',fileEncoding = 'utf-8',stringsAsFactors = FALSE)
# E3.Τα ονόματα των δήμων με τον μικρότερο αριθμό γυναικών ηλικίας μικρότερης από 20 (<20) ετών.
# create new col women <20
data$wu20=rowSums(data[,39:42])
minwu20_dimoi=min(data[data$level==5,'wu20'])
data[data$level==5 & data$wu20==minwu20_dimoi,'name']
# E5. Τη διάμεσο του συνολικού πληθυσμού ανεξαρτήτου ηλικίας και φύλου όλων των δημοτικών κοινοτήτων.
diamesos=median(data[data$level==7,'btotal'])
cat("E5.Διάμεσος ΣΠ ΔΚ:",diamesos)
Κώδικας Εργαστηρίου R Ακαδημαϊκό Έτος 2023-2024
# πήγαινε στο folder με το αρχείο με τη συνάρτηση setwd
# βρες το όνομα του folder: location στα properties του αρχείου
# άλλαξε το χαρακτήρα backslash με διπλό backslash ή με απλό χαρακτήρα slash
setwd("C:\\Users\\user\\Documents\\3333")
setwd("C:/Users/user/Documents/3333")
data=read.csv('GrCensus2011.csv',header=TRUE,sep=';',fileEncoding = 'utf-8',stringsAsFactors = FALSE)
# χειρισμός στηλών dataframe
# διάφοροι τρόποι χειρισμού στήλης
mtotal=min(data[,4])
mtotal=min(data[,"btotal"])
mtotal=min(data$btotal)
print(mtotal)
# ΒΡΕΣ ΤΟ ΕΛΑΧΙΣΤΟ ΤΟΥ ΣΥΝΟΛΙΚΟΥ ΠΛΗΘΥΣΜΟΥ ΤΩΝ ΔΗΜΩΝ
# βρες τις γραμμές των δήμων με τη συνάρτηση which()
# επιστρέφει vector με τους αριθμούς των γραμμών
# που ισχύει (δλδ η συνθήκη data$level==5)
linesdhmon=which(data$level==5)
# χρησιμοποιώ αυτό το vector για να ορίσω
# ποιές γραμμές θέλω και τη στήλη btotal
mdhmon=min(data[linesdhmon,"btotal"])
print(mdhmon)
#Armani way
cat('Ελάχιστος πληθυσμός δήμων:',min(data[which(data$level==5),"btotal"]))