Συστήματα Λογισμικού για διαχείριση και ανάλυση μεγάλου όγκου δεδομένων (MTE-2A4)

Σπύρος Σιούτας

Περιγραφή

Στόχος του μαθήματος είναι να εισάγει τους φοιτητές σε θέματα κατανεμημένων συστημάτων υπολογισμού και αποκεντρωμένων υποδομών με σκοπό την αποδοτική διαχείριση και ανάλυση μεγάλου όγκου δεδομένων. Συγκεκριμένα, το μάθημα εστιάζει στα παρακάτω:

  1. P2P υποδομές για διαχείριση δεδομένων μεγάλης κλίμακας
  2. DHT υποδομές για διαχείριση δεδομένων μεγάλης κλίμακας. Η μελέτη περίπτωσης του Chord
  3. DHT υποδομές για διαχείριση δεδομένων μεγάλης κλίμακας. Η μελέτη περίπτωσης του Pastry
  4. Internet Caching Πρωτόκολλα και Bloom Φίλτρα. Locality Sensitive Hashing (LSH)
  5. Πολυδιάστατα Δεδομένα και Μετρικές Ομοιότητας
  6. DataMining αλγόριθμοι για classification
  7. DataMining αλγόριθμοι για clustering
  8. Κατανεμημένα Συστήματα Διαχείρισης Αρχείων (HDFS / GFS)
  9. Map / Reduce Παράλληλος και Κατανεμημένος Προγραμματισμός για αποδοτική διαχείριση και ανάλυση δεδομένων μεγάλης κλίμακας
  10. NoSQL Βάσεις Δεδομένων

11. Εισαγωγή στο εργαλείο λογισμικού Apache Spark

 

ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Εβδομάδα  #1: Introduction to Advanced Distribu

Περισσότερα  

Ημερολόγιο