Διαχείριση Μεγάλων Δεδομένων (ΕΦΟ-03)

Εμμανουήλ Τζαγκαράκης

Περιγραφή

Στα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).

 

-Per aspera ad astra!

CC - Αναφορά Δημιουργού

Ενότητες

Εξεταστέα ύλη εξεταστικής περιόδου Φεβρουαρίου 2024, Ακαδημαϊκό έτος 2023 - 2024.

Αναλυτικοί βαθμοί εργασιών, εξέτασης και τελικοί βαθμοί μαθήματος "Διαχείριση Μεγάλων Δεδομένων" εξεταστικής περιόδου Φεβρ. 2024 ακαδημαϊκού έτους 2023-2024

Εγκατάσταση και χρήση της R και του RStudio. Το σύστημα βιβλιοθηκών της R. Μία πρώτη γνωριμία με την R.

 

Εγκατάσταση και χρήση της Python και σχετικών εργαλείων. Το σύστημα βιβλιοθηκών της Python. Μία πρώτη γνωριμία με την Python.

 

Εισαγωγικά στοιχεία για το μάθημα και μία σύντομη επισκόπηση της ύλης του.

Σχετικά με δεδομένα και τρόποι προεπεξεργασίας τους. Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis). Μέτρα ομοιότητας και απόστασης.

Regression analysis, OLS, Batch Gradient Descent, Stochastic Gradient Descent, Mini-Batch Gradient Descent, Prediction errors, Overfitting, Regularization

Classification, Class attribute, Discrete attributes, Decision Trees, K-Nearest Neighbors, Naive Bayes, Confusion matrix, Overfitting

K-means, Hierarchical clustering, distance metric

Itemsets, support, confidence, association rules, Apriori algorithm, Interestingness measures, Lift

Ημερολόγιο