Διαχείριση Μεγάλων Δεδομένων (ΕΦΟ-03)

Εμμανουήλ Τζαγκαράκης

Περιγραφή

Στα πλαίσια του μαθήματος θα παρουσιαστούν βασικές τεχνολογίες για τη συλλογή, αποθήκευση και επεξεργασία μεγάλων δεδομένων και ο ρόλος των τεχνολογιών αυτών στην οικονομική επιστήμη. Ιδιαίτερη έμφαση θα δοθεί στην επεξεργασία τέτοιων δεδομένων με τεχνικές εξόρυξης δεδομένων (data mining) με στόχο να δειχθεί πως συμβάλλουν σε διαδικασίες λήψης αποφάσεων. Το μάθημα επικεντρώνεται επίσης στην μελέτη περιπτώσεων (case studies).

 

-Per aspera ad astra!

CC - Αναφορά Δημιουργού

Ενότητες

Εξεταστέα ύλη εξεταστικής περιόδου Φεβρουαρίου 2025, Ακαδημαϊκό έτος 2024 - 2025.

Εγκατάσταση και χρήση της R και του RStudio. Το σύστημα βιβλιοθηκών της R. Μία πρώτη γνωριμία με την R.

 

Εγκατάσταση και χρήση της Python και σχετικών εργαλείων. Το σύστημα βιβλιοθηκών της Python. Μία πρώτη γνωριμία με την Python.

 

Εισαγωγικά στοιχεία για το μάθημα και μία σύντομη επισκόπηση της ύλης του.

Σχετικά με δεδομένα και τρόποι προεπεξεργασίας τους. Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis). Μέτρα ομοιότητας και απόστασης.

Regression analysis, OLS, Batch Gradient Descent, Stochastic Gradient Descent, Mini-Batch Gradient Descent, Prediction errors, Overfitting, Regularization

Classification, Class attribute, Discrete attributes, Decision Trees, K-Nearest Neighbors, Naive Bayes, Confusion matrix, Overfitting

K-means, Hierarchical clustering, distance metric

Itemsets, support, confidence, association rules, Apriori algorithm, Interestingness measures, Lift

Ημερολόγιο

Κυριακή
Δευτέρα
Τρίτη
Τετάρτη
Πέμπτη
Παρασκευή
Σάββατο
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5