Please ensure Javascript is enabled for purposes of website accessibility

Παρουσίαση/Προβολή

Εικόνα επιλογής

Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης

(CEID_562 ) -  Χρήστος Μακρής, Βασίλειος Μεγαλοοικονόμου

Περιγραφή Μαθήματος

Εισαγωγικές Έννοιες (διαδικασία εξόρυξης, κατηγοριοποίηση μεθόδων εξόρυξης, επισκόπηση εργασιών εξόρυξης), Αλγόριθμοι Κατηγοριοποίησης (Naive Bayes, k-NN, Δέντρα Απόφασης: ID3-C4.5), Μάθηση Κανόνων (Προτασιακών, Πρώτης Τάξεως, Επαγωγική Μάθηση), Αλγόριθμοι Συσταδοποίησης (διαιρετικοί αλγόριθμοι, ιεραρχικοί αλγόριθμοι, ιεραρχικοί και βασισμένοι σε γράφους, βασισμένοι στη πυκνότητα, βασισμένοι σε πλέγμα, συσταδοποίηση υποχώρων, συσταδοποίηση για σύνολα με λεκτικές τιμές, ασαφής συσταδοποίηση, σύγκριση αλγορίθμων συσταδοποίησης, Kohonen Net συσταδοποίηση, κλιμάκωση και στάθμιση). Κανόνες Συσχέτισης (αλγόριθμος Apriori, αλγόριθμος AprioriTID, αλγόριθμος FPGrowth, σύγκριση αλγορίθμων παραγωγής κανόνων συσχέτισης, αντιπροσωπευτικοί κανόνες συσχέτισης, ποσοτικοί κανόνες συσχέτισης), Αλγόριθμοι Μάθησης Συμβολικών Κανόνων, Διαχείριση Ποιότητας στην Εξόρυξη Γνώσης (αξιολόγηση μεθόδων κατηγοριοποίησης, μέτρα ενδιαφέροντος κανόνων συσχέτισης, εγκυρότητα συσταδοποίησης), Εξόρυξη Γνώσης στον Παγκόσμιο Ιστό.

Ημερομηνία δημιουργίας

Σάββατο, 17 Φεβρουαρίου 2018

  • Βιβλιογραφία

    Παρατίθεται σχετική βιβλιογραφία:

    DATA MINING, Margaret H. Dunham. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2004

    Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων, Αλ. Νανόπουλος - Γ. Μανωλόπουλος ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2008

    ΕΞΟΡΥΞΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ, MOHAMMED J. ZAKI, WAGNER MEIRA JR. ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, Έκδοση: 1η/2017

    Μ. Χαλκίδη, Μ. Βαζιργιάννης, Εξόρυξη Γνώσης από Βάσεις Δεδομένων και τον Παγκόσμιο Ιστό (Εκδόσεις: Τυπωθήτω), 2005

    Εισαγωγή στην εξόρυξη δεδομένων, 2η Έκδοση, Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), ΕΚΔΟΣΕΙΣ Α. ΤΖΙΟΛΑ & ΥΙΟΙ Α.Ε. Έκδοση: 2η/2018

    Tan, Steinbach, Kumar, Introduction to Data Mining, Addison-Wesley, 2007.

    T. M. Mitchell, Machine Learning, McGraw Hill, 1997.

    I.H. Witten, E. Frank, Data Mining, Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, October, 1999.

    Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2nd Edition, ISBN 1-55860-901-6, 2006.

    David J. Hand, Heikki Mannila and Padhraic Smyth, Principles of Data Mining , MIT Press, Fall 2000.

    S. Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data, Morgan-Kaufmann Publishers 2003

     

    Λογισμικό

    PANDAS

    Scikit-learn

    WEKA

    Ιστοσελίδες

    Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press

    Charu Aggarwal, Data Mining, the textbook. 2015

    Jure Leskovec, Anand Rajaraman, Jeff Ullman Mining of Massive Datasets, 

    Συμπληρωματικό Εκπαιδευτικό Υλικό (βοήθημα για εξετάσεις) 

     http://www.cs.wisc.edu/~dyer/cs540/notes/learning.htmlhttp://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.html

    Λογισμικό 

    WEKA

    Συνέδρια στην Εξόρυξη Δεδομένων 

    SIAM International Conference on Data Mining

    IEEE/WIC/ACM International Conference on Web Intelligence

    IEEE International Conference on Data Mining

    Web Search and Data Mining (WSDM)

    ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems

    ACM Conference on Information and Knowledge Management

    ACM SIGKDD International Conference on Knowledge Discovery and Data Mining

    Workshop on New Challenges for Feature Selection in Data Mining and Knowledge Discovery

    2008 IEEE/INFORMS International Conference on Service Operations and Logistics, and Informatics

    Workshop on Web and Text Intelligence 08

    Concept Lattices and Their Applications

    International Conference on Algorithmic Learning Theory

    International Conference on Discovery Science

    International Conference on Pattern Recognition

    KDD 2008 Workshop on Data Mining for Business Applications

    7th IEEE International Conference on Cybernetic Intelligent Systems 2008

    13th Iberoamerican Congress on Pattern Recognition

    Προτεινόμενα συγγράμματα

    Συγγράμματα

     

    • Διδακτικό Βιβλίο

      DATA MINING, Margaret H. Dunham. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2004

      Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων, Αλ. Νανόπουλος - Γ. Μανωλόπουλος ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2008

      ΕΞΟΡΥΞΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ, MOHAMMED J. ZAKI, WAGNER MEIRA JR. ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, Έκδοση: 1η/2017

      Εισαγωγή στην εξόρυξη δεδομένων, 2η Έκδοση, Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), ΕΚΔΟΣΕΙΣ Α. ΤΖΙΟΛΑ & ΥΙΟΙ Α.Ε. Έκδοση: 2η/2018

      Συμπληρωματικό Εκπαιδευτικό Υλικό (βοήθημα για εξετάσεις) :  βιβλίο (http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf)

      σημειώσεις,  http://www.cs.wisc.edu/~dyer/cs540/notes/learning.htmlhttp://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.htm.

    Μέθοδοι αξιολόγησης

    Αξιολόγηση

     

    Η αξιολόγηση συνίσταται σε μία γραπτή εξέταση (με κλειστά βιβλία) στις σημειώσεις του μαθήματος (70% συνεισφορά στο συνολικό βαθμό) και σε μία εργασία (σε ομάδες ενός ή δύο ατόμων - 30% συνεισφορά στον συνολικό βαθμό). Είναι δυνατη η διατηρηση του βαθμού της εργασίας από Ιούνιο για Σεπτέμβρη και επίσης η εργασία είναι ίδια Ιούνιο και Σεπτέμβρη. Δεν ειναι εφικτη όμως η διατηρηση του βαθμου των γραπτων εξετάσεων Ιουνίου και παράδοση/βαθμολόγηση project το Σεπτέβριο. Συνεπώς αν κάποιος θέλει να φέρει project το Σεπτέμβριο πρέπει να δώσει γραπτές εξετάσεις τότε. Η ύλη του μαθήματος (για τις εξετάσεις Ιουνίου, Σεπτεμβρίου),  είναι τα κεφάλαια 1-9 του βιβλίου: Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης Από Δεδομένα, της Margaret Dunham. 

    Η ύλη του μαθήματος είναι τα κεφάλαια 1-9 του βιβλίου: Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης Από Δεδομένα, της Margaret Dunham ΜΕ ΕΜΦΑΣΗ ΚΑΙ ΣΤΑ ΟΣΑ ΑΝΑΦΕΡΘΗΚΑΝ ΣΤΟ ΜΑΘΗΜΑ ΚΑΙ ΥΠΑΡΧΟΥΝ ΚΑΙ ΣΤΙΣ ΔΙΑΦΑΝΕΙΕΣ. ΑΝΤΙΣΤΟΙΧΗ ΥΛΗ ΣΑΝ ΣΥΝΟΛΟ ΥΠΑΡΧΕΙ ΣΤΟ ΕΓΧΕΙΡΙΔΙΟ ΤΩΝ ZAKI ΚΑΙ ΜΕΙRA (όλα το περιεχόμενο αυτού - https://dataminingbook.info/) .

    Περιεχόμενο μαθήματος

    Καλύπτονται βασικά θέματα του αντικειμένου όπως

    Αλγόριθμοι Κατηγοριοποίησης,

    Αλγόριθμοι Συσταδοποίησης,

    Κανόνες Συσχέτισης,

    Αλγόριθμοι Μάθησης Συμβολικών Κανόνων,

    Διαχείριση Ποιότητας στην Εξόρυξη Γνώσης,

    Εξόρυξη Δεδομένων στον Παγκόσμιο Ιστό,

    Εξόρυξη Δεδομένων από Χωρικά Δεδομένων,

    Εξόρυξη Δεδομένων από Χρονικά Δεδομένα.

    ΜΕ ΕΜΦΑΣΗ ΚΑΙ ΣΤΑ ΟΣΑ ΑΝΑΦΕΡΘΗΚΑΝ ΣΤΟ ΜΑΘΗΜΑ ΚΑΙ ΥΠΑΡΧΟΥΝ ΚΑΙ ΣΤΙΣ ΔΙΑΦΑΝΕΙΕΣ. (ΑΝΤΙΣΤΟΙΧΗ ΥΛΗ ΣΑΝ ΣΥΝΟΛΟ ΥΠΑΡΧΕΙ ΚΑΙ ΣΤΟ ΒΟΗΘΗΜΑ Charu Aggarwal, Data Mining, the textbook. 2015 ΠΟΥ ΣΑΣ  ΕΧΕΙ ΔΟΘΕΙ ΣΑΝ LINK ΣΤΟ E_CLASS KAI ΣΤΟ ΕΓΧΕΙΡΙΔΙΟ ΤΩΝ ZAKI ΚΑΙ ΜΕΙRA (όλα το περιεχόμενο αυτού )).

    Πληροφορίες
    Το μάθημα θα διδαχθεί για έβδομη χρονιά φέτος και  απευθύνεται σε όσους φοιτητές θέλουν να αποκτήσουν βασικές γνώσεις στην περιοχή της ανακάλυψης γνώσης από βάσεις δεδομένων, καθώς επίσης και στις πραγματικές τεχνικές που χρησιμοποιούνται για την ανάλυση και την εξαγωγή της από διάφορα σύνολα δεδομένων. Το μάθημα εξετάζει μία συνεχώς αναπτυσσόμενη (από άποψη τεχνικών και πεδίου εφαρμογών) περιοχή στον τομέα του Λογικού, και σχετίζεται με άλλα μαθήματα του Προγράμματος Σπουδών όπως:   Ανάκτηση Πληροφορίας, Βάσεις Δεδομένων I,II,  Τεχνητή Νοημοσύνη, Υπολογιστική Νοημοσύνη, Επιστημονικός Υπολογισμός Ι, ΙΙ και Τεχνολογίες Διαδικτύου.

    Διδάσκοντες

    ΔΙΔΑΣΚΟΝΤΕΣ

    Καθηγητής Βασίλειος Μεγαλoοικονόμου (vasilis@ceid.upatras.gr), Αναπληρωτής Καθ. Χρ. Μακρής  (makri@ceid.upatras.gr)

    Φροντιστήριο

    Εύα Ντούρου entourou@ceid.upatras.gr

    Μπομπότας Αγοράκης, mpompotas@ceid.upatras.gr Καλογερόπουλος Νικήτας-Ρήγας, kalogeropo@ceid.upatras.gr

    Αίθουσα διδασκαλίας: αίθουσα Δ1 Νέο Κτίριο Μηχανικών Η/Υ και Πληροφορικής (https://www.ceid.upatras.gr/sites/default/files/pages/building-map_0.pdf)

    ΩΡΕΣ ΜΑΘΗΜΑΤΟΣ

    Πέμπτη 09:00-11:00 (θεωρία), Παρασκευή 09:00-11:00 (φροντιστήριο) αίθουσα Δ1.

    Ώρες ενημέρωσης για Project:

    Kάθε  Πέμπτη 14:00-15:00  στο Yπολογιστικό Κέντρο (δεύτερος όροφος Νέου Κτιρίου Μηχανικών Η/Υ και Πληροφορικής).