Μάθημα : Διαχείριση Μεγάλων Δεδομένων (ΕΦΟ-03)
Κωδικός : ECON1332
-
Θεματικές Ενότητες
-
Εξεταστέα ύλη εξεταστικής περιόδου Φεβρουαρίου 2026 ακ. έτους 2025 - 2026
-
Θέματα παλαιότερων ετών
-
LAB - R: Εγκατάσταση και παραδείγματα χρήσης
-
LAB - Python: Εγκατάσταση και παραδείγματα χρήσης
-
Lecture1: Εισαγωγικά
-
Lecture 2: About data
-
Lecture 3: Regression analysis
-
Lecture 4: Classification
-
Lecture 5: Clustering
-
Lecture 6: Association rules analysis
-
Εξεταστέα ύλη εξεταστικής περιόδου Φεβρουαρίου 2026 ακ. έτους 2025 - 2026
Lecture 2: About data
Σχετικά με δεδομένα και τρόποι προεπεξεργασίας τους. Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis). Μέτρα ομοιότητας και απόστασης.
Reducing a two dimensional space and data (blue dots) into an one dimensional one - which is the goal of PCA. In PCA we search for Eigenvectors, where when data are projected onto them, their variance is at maximum. Projection of the original data (in blue) onto the eigenvectors are the red dots; variance of the red dots is expressing how far apart the red dots are on the eigenvector.
Real world example of PCA: reducing 3 dimensions (leafs of tree) to 2 (shaddow of leafs), while at the same time expressing great amount of variance of the original data.