Please ensure Javascript is enabled for purposes of website accessibility

Παρουσίαση/Προβολή

Εικόνα επιλογής

Ευφυής Έλεγχος

(ECE_ΔK807) -  Κωνσταντίνος Χατζηλυγερούδης

Περιγραφή Μαθήματος

  • Ευφυείς Πράκτορες
  • Τύποι πρακτόρων και περιβαλλόντων
  • Εισαγωγή στην Ενισχυτική Μάθηση
  • Markov Decision Processes
  • Ενισχυτική Μάθηση σε Γνωστά Διακριτά Περιβάλλοντα (Δυναμικός Προγραμματισμός)
  • Ενισχυτική Μάθηση σε Άγνωστα Περιβάλλοντα (Μέθοδοι Monte-Carlo, Temporal-Difference Learning, SARSA, Q-Learning)
  • Τεχνητά Νευρωνικά Δίκτυα και Μάθηση
  • Ενισχυτική Μάθηση σε Συνεχή Περιβάλλοντα (Μέθοδοι Policy Gradient)
  • Σύγχρονοι Αλγόριθμοι Ενισχυτικής Μάθησης
  • Ενισχυτική Μάθηση μέσω Εξελικτικών Αλγορίθμων (Evolutionary Strategies/Genetic Algorithms)
  • Εξελικτικοί Αλγόριθμοι “Quality-Diversity”
  • Ενισχυτική Μάθηση βασισμένη σε μοντέλα
  • Μάθηση σε πραγματικά συστήματα
  • Εισαγωγή στην Ασαφή Λογική
  • Ασαφής έλεγχος
  • Neuro-fuzzy control.

Ημερομηνία δημιουργίας

Παρασκευή, 9 Φεβρουαρίου 2024

  • Μαθησιακοί στόχοι

    Με την επιτυχή περάτωση  της εκπαιδευτικής διαδικασίας, οι φοιτητές θα έχουν αποκτήσει τις απαραίτητες γνώσεις, ώστε:

    1. Να κατανοούν το πρόβλημα της ενισχυτικής μάθησης και τη βασική μοντελοποίηση (μέσω Markov Decision Processes).
    2. Να κατανοούν τα βασικά συστατικά ενός αλγορίθμου ενισχυτικής μάθησης (στρατηγική, συνάρτηση τιμής, μοντέλο κόσμου).
    3. Να υλοποιούν τους βασικούς αλγορίθμους ενισχυτικής μάθησης.
    4. Να κατανοούν τις βασικές λειτουργίες των τεχνητών νευρωνικών δικτύων και να τα χρησιμοποιούν σε προβλήματα ενισχυτικής μάθησης.
    5. Να υλοποιούν τους βασικούς εξελικτικούς και γενετικούς αλγορίθμους για βελτιστοποίηση και ενισχυτική μάθηση.
    6. Να κατανοούν τις δυσκολίες που έχει η εφαρμογή αλγορίθμων μάθησης σε πραγματικά συστήματα.

    Μέθοδοι διδασκαλίας

    • Τρόπος Παράδοσης: Δια ζώσης διαλέξεις
    • Χρήση Τεχνολογιών Πληροφορίας και Επικοινωνιών: Ναι

    Μέθοδοι αξιολόγησης

    • Εργαστήριο (20%)
    • Ενδιάμεσοι Πρόοδοι/Εξετάσεις (30%)
    • Τελική Εξέταση ή Απαλλακτική Εργασία (50%)

     

    Οι εξετάσεις (και οι πρόοδοι) πραγματοποιούνται με ηλεκτρονικά μέσα και περιλαμβάνουν και συγγραφή κώδικα.