Διαχείριση Μεγάλων Δεδομένων (ΕΦΟ-03)
Εμμανουήλ Τζαγκαράκης
Στα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).
-Per aspera ad astra!
ΛιγότεραΣτα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).
-Per aspera ad astra!
Στα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).
-Per aspera ad astra!
Εγκατάσταση και χρήση της R και του RStudio. Το σύστημα βιβλιοθηκών της R. Μία πρώτη γνωριμία με την R.
Εγκατάσταση και χρήση της Python και σχετικών εργαλείων. Το σύστημα βιβλιοθηκών της Python. Μία πρώτη γνωριμία με την Python.
Εισαγωγικά στοιχεία για το μάθημα και μία σύντομη επισκόπηση της ύλης του.
Σχετικά με δεδομένα και τρόποι προεπεξεργασίας τους. Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis). Μέτρα ομοιότητας και απόστασης.
Regression analysis, OLS, Batch Gradient Descent, Stochastic Gradient Descent, Mini-Batch Gradient Descent, Prediction errors, Overfitting, Regularization
Classification, Class attribute, Discrete attributes, Decision Trees, K-Nearest Neighbors, Naive Bayes, Confusion matrix, Overfitting
K-means, Hierarchical clustering, distance metric