Παρουσίαση/Προβολή
Αλγοριθμικές Τεχνικές Επιστήμης Δεδομένων 2025-2026
(24ΕΕ594) - Χρήστος Ζαρολιάγκης & Σπύρος Κοντογιάννησς
Περιγραφή Μαθήματος
Η Επιστήμη Δεδομένων είναι ένα διεπιστημονικό πεδίο του οποίου αντικείμενο είναι η ανάπτυξη μεθόδων, διαδικασιών και συστημάτων για την εξαγωγή γνώσης από αδόμητη ή δομημένη πληροφορία. Αφορά σε μια νέα προσέγγιση αντιμετώπισης της διαρκώς αυξανόμενης ανάγκης ανάλυσης δεδομένων, η οποία έχει προκύψει τα τελευταία χρόνια με την έκρηξη του διαδικτύου και την εμφάνιση δεδομένων τεράστιου όγκου σε πολλές εφαρμογές.
Σκοπός αυτού του μαθήματος είναι η παρουσίαση και η κριτική κατανόηση προηγμένων αλγοριθμικών τεχνικών ανάλυσης όγκου και πολυπλοκότητας δεδομένων. Συγκεκριμένα παρουσιάζονται: μοντέλα και προγραμματιστικές τεχνικές επεξεργασίας μεγάλου όγκου δεδομένων· πολυπλοκότητα αλγορίθμων μεγάλου όγκου δεδομένων· εξερεύνηση κανόνων συσχέτισης μέσω συχνών ομάδων αντικειμένων· κατακερματισμός ευαίσθητος ως προς την τοπικότητα· συσταδοποίηση δεδομένων· μείωση διάστασης· ανάλυση συνδέσμων και συσχετίσεων σε τεράστια γραφήματα (π.χ., PageRank)· ανάλυση κοινωνικών δικτύων και εντοπισμός κοινοτήτων· συστήματα παροχής συστάσεων· αλγόριθμοι για ροές μεγάλου όγκου δεδομένων. Ιδιαίτερη έμφαση δίνεται στις θεμελιώδεις αλγοριθμικές τεχνικές ανάλυσης και επεξεργασίας δεδομένων μεγάλου όγκου, καθώς και στην εφαρμοσιμότητά τους σε πληθώρα πρακτικών εφαρμογών.
Ημερομηνία δημιουργίας
Πέμπτη 12 Φεβρουαρίου 2026
-
Διδασκαλία
Διαλέξεις & Φροντιστήρια: Δευτέρα 11:00 - 13:00, αίθουσα Δ1 [Έναρξη 02.03.2026]
Μαθησιακοί Στόχοι
Στο πλαίσιο του μαθήματος, οι φοιτητές/τριες καλούνται να:
- Κατανοήσουν τεχνικές και εφαρμογές θεμελιωδών και προηγμένων αλγοριθμικών μεθόδων για διαχείριση μεγάλου όγκου δεδομένων.
- Εφαρμόσουν αλγοριθμικές τεχνικές και αποδοτικές υλοποιήσεις για την ανάλυση μεγάλου όγκου δεδομένων.
- Εφαρμόσουν μεθοδολογίες για εκτενή πειραματική ανάλυση μεγάλου όγκου δεδομένων, καθώς και για πειραματική αξιολόγηση αλγορίθμων σε σύνολα μεγάλου όγκου δεδομένων του πραγματικού κόσμου.
Το μάθημα στοχεύει στην εξοικείωση των φοιτητών/τριών με την:
- Ικανότητα συσχέτισης των δεδομένων με φαινόμενα που παρατηρούνται στον πραγματικό κόσμο, αλλά και να αντιμετωπίζει κριτικά τα συμπεράσματα που προκύπτουν από την ανάλυση μεγάλου όγκου δεδομένων.
- Ικανότητα δημιουργίας και αξιοποίησης αφαιρετικών μοντέλων και διεργασιών που επιτρέπουν την ενσωμάτωση διαδικασιών εξαγωγής συμπερασμάτων σε αλγόριθμους για επεξεργασία μεγάλου όγκου δεδομένων, με τρόπο που να εξασφαλίζεται ομαλότερη κλιμάκωση, ανθεκτικότητα και κατανόησή τους.
- Εμπειρία στον πειραματισμό με διαχείριση μεγάλου όγκου δεδομένων του πραγματικού κόσμου, όπως οικονομικά δεδομένα, συλλογές εγγράφων, γεωγραφικά δεδομένα, δεδομένα κοινωνικών δικτύων, κ.λπ.
Βιβλιογραφία
- Anand Rajaraman, Jeffrey D. Ullman. Εξόρυξη από Μεγάλα Σύνολα Δεδομένων - 3η Ελληνική Έκδοση, ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΚΕ, 2020.
- Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman. Mining of Massive Datasets. 3rd edition, Cambrdige University Press, 2019.
- Steven Skienna. The Data Science Design Manual, Springer 2017.
- Avrim Blum, John Hopcroft and Ravindran Kannan. Foundations of Data Science, 2017.
- Reza Zafarani, Mohammad Ali Abbasi, Huan Liu. Social Media Mining ? An Introduction. Cambridge University Press, 2014.
- Jimmy Lin and Chris Dyer. Data-Intensive Text Processing with MapReduce. Morgan & Claypool Publishers, 2010.
Μέθοδοι Αξιολόγησης
Η αξιολόγηση του μαθήματος πραγματοποιείται με τελική εξέταση στο τέλος του εαρινού εξαμήνου (με ανοικτές σημειώσεις) καθώς και εξέταση σε εργαστηριακές ασκήσεις που θα διεξαχθούν κατά τη διάρκεια του εαρινού εξαμήνου. Συγκεκριμένα:
- Προγραμματιστικές ασκήσεις (30% του τελικού βαθμού). Οι ασκήσεις αυτές είναι υποχρεωτικές και έχουν στόχο την εξοικείωση, εξάσκηση και απόκτηση εμπειρίας στην πρακτική διαχείριση μεγάλων συνόλων δεδομένων του πραγματικού κόσμου.
- Τελική εξέταση (70% του τελικού βαθμού). Η τελική εξέταση είναι προφορική ή γραπτή σε θέματα διαβαθμισμένης δυσκολίας, η οποία περιλαμβάνει ερωτήσεις σύντομης απάντησης, επίλυση προβλημάτων με εφαρμογή ή/και ανάπτυξη αλγορίθμων, αποδείξεις ορθότητας και πολυπλοκότητας αλγορίθμων, καθώς και μοντελοποίηση και επίλυση προβλημάτων.
Ο τελικός βαθμός του μαθήματος προκύπτει από τον παρακάτω τύπο:
Τελικός Βαθμός = 0.3 x (Μ.Ο. Βαθμού Εργαστηριακών Ασκήσεων) + 0.7 x (Βαθμός Τελικής Εξέτασης)