Παρουσίαση/Προβολή
Εξόρυξη Δεδομένων και Αλγόριθμοι Μάθησης
(CEID_562 ) - Χρήστος Μακρής, Βασίλειος Μεγαλοοικονόμου
Περιγραφή Μαθήματος
Εισαγωγικές Έννοιες (διαδικασία εξόρυξης, κατηγοριοποίηση μεθόδων εξόρυξης, επισκόπηση εργασιών εξόρυξης), Αλγόριθμοι Κατηγοριοποίησης (Naive Bayes, k-NN, Δέντρα Απόφασης: ID3-C4.5), Μάθηση Κανόνων (Προτασιακών, Πρώτης Τάξεως, Επαγωγική Μάθηση), Αλγόριθμοι Συσταδοποίησης (διαιρετικοί αλγόριθμοι, ιεραρχικοί αλγόριθμοι, ιεραρχικοί και βασισμένοι σε γράφους, βασισμένοι στη πυκνότητα, βασισμένοι σε πλέγμα, συσταδοποίηση υποχώρων, συσταδοποίηση για σύνολα με λεκτικές τιμές, ασαφής συσταδοποίηση, σύγκριση αλγορίθμων συσταδοποίησης, Kohonen Net συσταδοποίηση, κλιμάκωση και στάθμιση). Κανόνες Συσχέτισης (αλγόριθμος Apriori, αλγόριθμος AprioriTID, αλγόριθμος FPGrowth, σύγκριση αλγορίθμων παραγωγής κανόνων συσχέτισης, αντιπροσωπευτικοί κανόνες συσχέτισης, ποσοτικοί κανόνες συσχέτισης), Αλγόριθμοι Μάθησης Συμβολικών Κανόνων, Διαχείριση Ποιότητας στην Εξόρυξη Γνώσης (αξιολόγηση μεθόδων κατηγοριοποίησης, μέτρα ενδιαφέροντος κανόνων συσχέτισης, εγκυρότητα συσταδοποίησης), Εξόρυξη Γνώσης στον Παγκόσμιο Ιστό.
Ημερομηνία δημιουργίας
Σάββατο, 17 Φεβρουαρίου 2018
-
Βιβλιογραφία
Παρατίθεται σχετική βιβλιογραφία:
DATA MINING, Margaret H. Dunham. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2004
Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων, Αλ. Νανόπουλος - Γ. Μανωλόπουλος ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2008
ΕΞΟΡΥΞΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ, MOHAMMED J. ZAKI, WAGNER MEIRA JR. ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, Έκδοση: 1η/2017
Μ. Χαλκίδη, Μ. Βαζιργιάννης, Εξόρυξη Γνώσης από Βάσεις Δεδομένων και τον Παγκόσμιο Ιστό (Εκδόσεις: Τυπωθήτω), 2005
Εισαγωγή στην εξόρυξη δεδομένων, 2η Έκδοση, Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), ΕΚΔΟΣΕΙΣ Α. ΤΖΙΟΛΑ & ΥΙΟΙ Α.Ε. Έκδοση: 2η/2018
Tan, Steinbach, Kumar, Introduction to Data Mining, Addison-Wesley, 2007.
T. M. Mitchell, Machine Learning, McGraw Hill, 1997.
I.H. Witten, E. Frank, Data Mining, Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, October, 1999.
Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2nd Edition, ISBN 1-55860-901-6, 2006.
David J. Hand, Heikki Mannila and Padhraic Smyth, Principles of Data Mining , MIT Press, Fall 2000.
S. Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data, Morgan-Kaufmann Publishers 2003
Λογισμικό
WEKA
- Για να κατεβάσετε το WEKA, θα μπείτε στη διεύθυνση: http://www.cs.waikato.ac.nz/ml/weka/ ή στη διεύθυνση: http://sourceforge.net/projects/weka/
Ιστοσελίδες
Charu Aggarwal, Data Mining, the textbook. 2015
Jure Leskovec, Anand Rajaraman, Jeff Ullman Mining of Massive Datasets,
Συμπληρωματικό Εκπαιδευτικό Υλικό (βοήθημα για εξετάσεις) :
http://www.cs.wisc.edu/~dyer/cs540/notes/learning.html, http://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.html
Λογισμικό
Συνέδρια στην Εξόρυξη Δεδομένων
SIAM International Conference on Data Mining
IEEE/WIC/ACM International Conference on Web Intelligence
IEEE International Conference on Data Mining
Web Search and Data Mining (WSDM)
ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems
ACM Conference on Information and Knowledge Management
ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
Workshop on New Challenges for Feature Selection in Data Mining and Knowledge Discovery
2008 IEEE/INFORMS International Conference on Service Operations and Logistics, and Informatics
Workshop on Web and Text Intelligence 08
Concept Lattices and Their Applications
International Conference on Algorithmic Learning Theory
International Conference on Discovery Science
International Conference on Pattern Recognition
KDD 2008 Workshop on Data Mining for Business Applications
7th IEEE International Conference on Cybernetic Intelligent Systems 2008
Προτεινόμενα συγγράμματα
Συγγράμματα
- Διδακτικό Βιβλίο:
DATA MINING, Margaret H. Dunham. ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2004
Εισαγωγή στην Εξόρυξη Δεδομένων και τις Αποθήκες Δεδομένων, Αλ. Νανόπουλος - Γ. Μανωλόπουλος ΕΚΔΟΣΕΙΣ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΙΔΙΩΤΙΚΗ ΚΕΦΑΛΑΙΟΥΧΙΚΗ ΕΤΑΙΡΕΙΑ Έκδοση: 1η/2008
ΕΞΟΡΥΞΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΑΛΓΟΡΙΘΜΟΙ, MOHAMMED J. ZAKI, WAGNER MEIRA JR. ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ, Έκδοση: 1η/2017
Εισαγωγή στην εξόρυξη δεδομένων, 2η Έκδοση, Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), ΕΚΔΟΣΕΙΣ Α. ΤΖΙΟΛΑ & ΥΙΟΙ Α.Ε. Έκδοση: 2η/2018
Συμπληρωματικό Εκπαιδευτικό Υλικό (βοήθημα για εξετάσεις) : βιβλίο (http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf)
σημειώσεις, http://www.cs.wisc.edu/~dyer/cs540/notes/learning.html, http://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.htm.
Μέθοδοι αξιολόγησης
Αξιολόγηση
Η αξιολόγηση συνίσταται σε μία γραπτή εξέταση (με κλειστά βιβλία) στις σημειώσεις του μαθήματος (70% συνεισφορά στο συνολικό βαθμό) και σε μία εργασία (σε ομάδες ενός ή δύο ατόμων - 30% συνεισφορά στον συνολικό βαθμό). Είναι δυνατη η διατηρηση του βαθμού της εργασίας από Ιούνιο για Σεπτέμβρη και επίσης η εργασία είναι ίδια Ιούνιο και Σεπτέμβρη. Δεν ειναι εφικτη όμως η διατηρηση του βαθμου των γραπτων εξετάσεων Ιουνίου και παράδοση/βαθμολόγηση project το Σεπτέβριο. Συνεπώς αν κάποιος θέλει να φέρει project το Σεπτέμβριο πρέπει να δώσει γραπτές εξετάσεις τότε. Η ύλη του μαθήματος (για τις εξετάσεις Ιουνίου, Σεπτεμβρίου), είναι τα κεφάλαια 1-9 του βιβλίου: Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης Από Δεδομένα, της Margaret Dunham.
Η ύλη του μαθήματος είναι τα κεφάλαια 1-9 του βιβλίου: Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης Από Δεδομένα, της Margaret Dunham ΜΕ ΕΜΦΑΣΗ ΚΑΙ ΣΤΑ ΟΣΑ ΑΝΑΦΕΡΘΗΚΑΝ ΣΤΟ ΜΑΘΗΜΑ ΚΑΙ ΥΠΑΡΧΟΥΝ ΚΑΙ ΣΤΙΣ ΔΙΑΦΑΝΕΙΕΣ. ΑΝΤΙΣΤΟΙΧΗ ΥΛΗ ΣΑΝ ΣΥΝΟΛΟ ΥΠΑΡΧΕΙ ΣΤΟ ΕΓΧΕΙΡΙΔΙΟ ΤΩΝ ZAKI ΚΑΙ ΜΕΙRA (όλα το περιεχόμενο αυτού - https://dataminingbook.info/) .
Περιεχόμενο μαθήματος
Καλύπτονται βασικά θέματα του αντικειμένου όπως
Αλγόριθμοι Κατηγοριοποίησης,
Αλγόριθμοι Συσταδοποίησης,
Κανόνες Συσχέτισης,
Αλγόριθμοι Μάθησης Συμβολικών Κανόνων,
Διαχείριση Ποιότητας στην Εξόρυξη Γνώσης,
Εξόρυξη Δεδομένων στον Παγκόσμιο Ιστό,
Εξόρυξη Δεδομένων από Χωρικά Δεδομένων,
Εξόρυξη Δεδομένων από Χρονικά Δεδομένα.
ΜΕ ΕΜΦΑΣΗ ΚΑΙ ΣΤΑ ΟΣΑ ΑΝΑΦΕΡΘΗΚΑΝ ΣΤΟ ΜΑΘΗΜΑ ΚΑΙ ΥΠΑΡΧΟΥΝ ΚΑΙ ΣΤΙΣ ΔΙΑΦΑΝΕΙΕΣ. (ΑΝΤΙΣΤΟΙΧΗ ΥΛΗ ΣΑΝ ΣΥΝΟΛΟ ΥΠΑΡΧΕΙ ΚΑΙ ΣΤΟ ΒΟΗΘΗΜΑ Charu Aggarwal, Data Mining, the textbook. 2015 ΠΟΥ ΣΑΣ ΕΧΕΙ ΔΟΘΕΙ ΣΑΝ LINK ΣΤΟ E_CLASS KAI ΣΤΟ ΕΓΧΕΙΡΙΔΙΟ ΤΩΝ ZAKI ΚΑΙ ΜΕΙRA (όλα το περιεχόμενο αυτού )).
Πληροφορίες
Το μάθημα θα διδαχθεί για έβδομη χρονιά φέτος και απευθύνεται σε όσους φοιτητές θέλουν να αποκτήσουν βασικές γνώσεις στην περιοχή της ανακάλυψης γνώσης από βάσεις δεδομένων, καθώς επίσης και στις πραγματικές τεχνικές που χρησιμοποιούνται για την ανάλυση και την εξαγωγή της από διάφορα σύνολα δεδομένων. Το μάθημα εξετάζει μία συνεχώς αναπτυσσόμενη (από άποψη τεχνικών και πεδίου εφαρμογών) περιοχή στον τομέα του Λογικού, και σχετίζεται με άλλα μαθήματα του Προγράμματος Σπουδών όπως: Ανάκτηση Πληροφορίας, Βάσεις Δεδομένων I,II, Τεχνητή Νοημοσύνη, Υπολογιστική Νοημοσύνη, Επιστημονικός Υπολογισμός Ι, ΙΙ και Τεχνολογίες Διαδικτύου.Διδάσκοντες
ΔΙΔΑΣΚΟΝΤΕΣ
Καθηγητής Βασίλειος Μεγαλoοικονόμου (vasilis@ceid.upatras.gr), Αναπληρωτής Καθ. Χρ. Μακρής (makri@ceid.upatras.gr)
Φροντιστήριο
Εύα Ντούρου entourou@ceid.upatras.gr
Μπομπότας Αγοράκης, mpompotas@ceid.upatras.gr Καλογερόπουλος Νικήτας-Ρήγας, kalogeropo@ceid.upatras.gr
Αίθουσα διδασκαλίας: αίθουσα Δ1 Νέο Κτίριο Μηχανικών Η/Υ και Πληροφορικής (https://www.ceid.upatras.gr/sites/default/files/pages/building-map_0.pdf)
ΩΡΕΣ ΜΑΘΗΜΑΤΟΣ
Πέμπτη 09:00-11:00 (θεωρία), Παρασκευή 09:00-11:00 (φροντιστήριο) αίθουσα Δ1.
Ώρες ενημέρωσης για Project:
Kάθε Πέμπτη 14:00-15:00 στο Yπολογιστικό Κέντρο (δεύτερος όροφος Νέου Κτιρίου Μηχανικών Η/Υ και Πληροφορικής).