Διαχείριση Μεγάλων Δεδομένων (ΕΦΟ-03)

Εμμανουήλ Τζαγκαράκης

Πρόβλημα! Άγνωστος πόρος ενότητας
Περιγραφή

Στα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).

 

-Per aspera ad astra!

CC - Αναφορά Δημιουργού

Ενότητες

Εγκατάσταση και χρήση της R και του RStudio. Το σύστημα βιβλιοθηκών της R. Μία πρώτη γνωριμία με την R.

 

Εγκατάσταση και χρήση της Python και σχετικών εργαλείων. Το σύστημα βιβλιοθηκών της Python. Μία πρώτη γνωριμία με την Python.

 

Εισαγωγικά στοιχεία για το μάθημα και μία σύντομη επισκόπηση της ύλης του.

Σχετικά με δεδομένα και τρόποι προεπεξεργασίας τους. Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis). Μέτρα ομοιότητας και απόστασης.

Regression analysis, OLS, Batch Gradient Descent, Stochastic Gradient Descent, Mini-Batch Gradient Descent, Prediction errors, Overfitting, Regularization

Classification, Class attribute, Discrete attributes, Decision Trees, K-Nearest Neighbors, Naive Bayes, Confusion matrix, Overfitting

Ημερολόγιο