Περιεχόμενο μαθήματος

Περιεχόμενο μαθήματος

Α' Μέρος: Ρομποτική

 

  • Εισαγωγή στη Ρομποτική
  • Κινηματική Ανάλυση Ρομποτικών Συστημάτων
  • Γενικευμένες Συντεταγμένες
  • Δυναμική Ανάλυση Ρομποτικών Συστημάτων
  • Έλεγχος Ρομποτικών Συστημάτων
  • Υπολογισμός Τροχιάς και Έλεγχος στον Καρτεσιανό Χώρο
  • Πρόβλημα  SLAM και Tracking
  • Ρομποτικοί προσομοιωτές (simulators)

 

Β' Μέρος: Ευφυείς Πράκτορες/Ενισχυτική Μάθηση

 

  • Εισαγωγή στην Ενισχυτική Μάθηση/Βασικές Έννοιες Ευφυών Πρακτόρων
  • Markov Decision Processes
  • Δυναμικός Προγραμματισμός: Iterative Policy Evaluation, Policy/Value Iteration
  • Temporal Difference Learning
  • Αλγόριθμοι SARSA, Q-Learning
  • Policy Gradient Μέθοδοι
  • Ενισχυτική Μάθηση με Δέσμες (Batch RL)/Actor-Critic Methods
  • Ενισχυτική Μάθηση με χρήση Black-Box Optimization
  • Ενισχυτική Μάθηση βασισμένη σε Μοντέλα
  • Ενισχυτική Μάθηση με Λίγα Δεδομένα

 

Γ' Μέρος: Ευφυή Συστήματα Με Κανόνες

 

  • Εισαγωγή στον προγραμματισμό με κανόνες
  • Κανόνες βασισμένοι στο ταίριασμα προτύπων
  • Αλγόριθμος Rete
  • Ανάπτυξη Έμπειρων Συστημάτων (ΕΣ)
  • Δημιουργία Βάσεων Κανόνων από Δεδομένα/Δένδρα Αποφάσεων
  • Προετοιμασία Συνόλου Δεδομένων
  • Εξαγωγή Κανόνων
  • Επαλήθευση-Εγκυροποίηση Βάσεων Κανόνων
  • Αξιολόγηση ΕΣ
  • Κέλυφος Ανάπτυξης ΕΣ CLIPS (ή παρόμοιο)

 

Μαθησιακοί στόχοι

Μαθησιακοί στόχοι

Στόχος του μαθήματος είναι να παρέχει στους φοιτητές γνώση σε θεωρητικό και πρακτικό επίπεδο σχετική με τη ανάπτυξη ευφυών συστημάτων και τη ρομποτική. Δίνεται μεγάλη έμφαση στην πρακτική εξάσκηση και στο να μάθουν οι φοιτητές να χρησιμοποιούν εργαλεία. Τέτοια εργαλεία είναι: ρομποτικοί προσομοιωτές (π.χ. DART), και βιβλιοθήκες που προσφέρουν διάφορες μεθόδους χρήσιμες σε ευφυή συστήματα (π.χ. CLIPS, sklearn, numpy, openai-gym κτλ).

 

Βιβλιογραφία

Βιβλιογραφία

  • «Τεχνητή Νοημοσύνη», Ι. Βλαχάβας, Π. Κεφαλας, Ν. Βασιλειάδης, Φ. Κόκκορας και Η. Σακελλαρίου-Γ' ΈκδοσηΕκδ. Β. Γκιούρδας, Αθήνα, 2006
  • Reinforcement Learning: An Introduction, 2nd Edition, Richard S. Sutton, Andrew G. Barto, 2015, MIT Press. ebook
  • Algorithms for Reinforcement Learning, Csaba Szepesvari, 2009, Morgan & Claypool Publishers. ebook
  • "Modern Robotics: Mechanics, Planning, and Control," Kevin M. Lynch and Frank C. Park, Cambridge University Press, 2017. ebook
  • CLIPS: http://clipsrules.sourceforge.net

Προαπαιτούμενα

Προαπαιτούμενα

Καλές γνώσεις Προγραμματισμού

Αξιολόγηση Μαθήματος

Μέθοδοι αξιολόγησης

Το μάθημα αξιολογείται με δύο εργασίες (πρότζεκτ). Η πρώτη εργασία θα αφορά την υλοποίηση ενός προγράμματος ελέγχου ενός ρομποτικού βραχίωνα, ενώ η δεύτερη εργασία θα αφορά την εκμάθηση του ίδιου ελέγκτη με διαφορετικές μεθόδους (ενισχυτική μάθηση ή κανόνες).

 

Η κάθε εργασία θα βαθμολογείται τόσο από τον κώδικα και την αναφορά που παραδίδεται, αλλά και από προφορική εξέταση.

 

Η τελική βαθμολογία θα είναι ως εξής: Βαθμός = 0.4*ΕργΑ+0.6*ΕργΒ, όπου ΕργΑ είναι ο βαθμός της πρώτης εργασίας και ΕργΒ της δεύτερης.