Παρουσίαση/Προβολή
Ευφυής Έλεγχος
(ECE_ΔK807) - Κωνσταντίνος Χατζηλυγερούδης
Περιγραφή Μαθήματος
- Ευφυείς Πράκτορες
- Τύποι πρακτόρων και περιβαλλόντων
- Εισαγωγή στην Ενισχυτική Μάθηση
- Markov Decision Processes
- Ενισχυτική Μάθηση σε Γνωστά Διακριτά Περιβάλλοντα (Δυναμικός Προγραμματισμός)
- Ενισχυτική Μάθηση σε Άγνωστα Περιβάλλοντα (Μέθοδοι Monte-Carlo, Temporal-Difference Learning, SARSA, Q-Learning)
- Τεχνητά Νευρωνικά Δίκτυα και Μάθηση
- Ενισχυτική Μάθηση σε Συνεχή Περιβάλλοντα (Μέθοδοι Policy Gradient)
- Σύγχρονοι Αλγόριθμοι Ενισχυτικής Μάθησης
- Ενισχυτική Μάθηση μέσω Εξελικτικών Αλγορίθμων (Evolutionary Strategies/Genetic Algorithms)
- Εξελικτικοί Αλγόριθμοι “Quality-Diversity”
- Ενισχυτική Μάθηση βασισμένη σε μοντέλα
- Μάθηση σε πραγματικά συστήματα
- Εισαγωγή στην Ασαφή Λογική
- Ασαφής έλεγχος
- Neuro-fuzzy control.
Ημερομηνία δημιουργίας
Παρασκευή, 9 Φεβρουαρίου 2024
-
Μαθησιακοί στόχοι
Με την επιτυχή περάτωση της εκπαιδευτικής διαδικασίας, οι φοιτητές θα έχουν αποκτήσει τις απαραίτητες γνώσεις, ώστε:
- Να κατανοούν το πρόβλημα της ενισχυτικής μάθησης και τη βασική μοντελοποίηση (μέσω Markov Decision Processes).
- Να κατανοούν τα βασικά συστατικά ενός αλγορίθμου ενισχυτικής μάθησης (στρατηγική, συνάρτηση τιμής, μοντέλο κόσμου).
- Να υλοποιούν τους βασικούς αλγορίθμους ενισχυτικής μάθησης.
- Να κατανοούν τις βασικές λειτουργίες των τεχνητών νευρωνικών δικτύων και να τα χρησιμοποιούν σε προβλήματα ενισχυτικής μάθησης.
- Να υλοποιούν τους βασικούς εξελικτικούς και γενετικούς αλγορίθμους για βελτιστοποίηση και ενισχυτική μάθηση.
- Να κατανοούν τις δυσκολίες που έχει η εφαρμογή αλγορίθμων μάθησης σε πραγματικά συστήματα.
Μέθοδοι διδασκαλίας
- Τρόπος Παράδοσης: Δια ζώσης διαλέξεις
- Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών: Ναι
Μέθοδοι αξιολόγησης
- Εργαστήριο (20%)
- Ενδιάμεσοι Πρόοδοι/Εξετάσεις (30%)
- Τελική Εξέταση ή Απαλλακτική Εργασία (50%)
Οι εξετάσεις (και οι πρόοδοι) πραγματοποιούνται με ηλεκτρονικά μέσα και περιλαμβάνουν και συγγραφή κώδικα.