ΥΠΟΛΟΓΙΣΤΙΚΗ ΝΟΗΜΟΣΥΝΗ ΙΙ

 

7.10     ΣΥΖΗΤΗΣΗ ΚΑΙ ΣΥΜΠΕΡΑΣΜΑΤΑ

 

Σ’ αυτή την εργασία, παρουσιάσαμε ένα ενοποιημένο πλαίσιο για την εξαγωγή της δομής ενός νευρωνικού δικτύου από δεδομένα εισόδου/εξόδου, χρησιμοποιώντας τα αποτελέσματα της θεωρίας βέλτιστου φιλτραρίσματος , εξελικτικές μεθόδους και την αναδυόμενη τεχνολογία των νευρωνικών δικτύων. Οι τρεις πρώτες μέθοδοι βασίζονται στην αναδιατύπωση του προβλήματος στον κλασσικό τύπο του χώρου καταστάσεων. Κατόπιν χρησιμοποιείται η θεωρία διαμερισμού πολλαπλών μοντέλων, σε συνδυασμό με τοπικούς, σε επίπεδο νευρώνα, αλγορίθμους γρήγορης μάθησης, σε περιοδικά  (recurrent) τροφοδοτούμενα προς τα μπρος (feed-forward ) νευρωνικά δίκτυα. Παρουσιάζονται τρεις διαφορετικές προσαρμοστικές ΝΝ υλοποιήσεις, βασισμένες στη γνωστή θεωρία διαμερισμού πολλαπλών μοντέλων. Στην πρώτη  χρησιμοποιείται μια ομάδα (bank) από περιοδικά (recurrent) ΝΝ, όπου καθένα ταιριάζει σ’ ένα διαφορετικής τάξης μοντέλο. Στη δεύτερη, παρουσιάζεται μια πιο ελκυστική αυτο-οργανωτική υλοποίηση, όπου το δίκτυο προσαρμόζει μια από τις εξόδους του στο σωστό μοντέλο. Η τρίτη μέθοδος βασίζεται στο GMDH, σε συνδυασμό με τη θεωρία διαμερισμού πολλαπλών μοντέλων. Η συνολική διαδικασία  είναι ένα διευθυνόμενο παράδειγμα μάθησης, όπου η εκπαίδευση εκτελείται μέσω γρήγορων EBP και τύπου ΜΕΚΑ αλγορίθμων, οι οποίοι παρά τον υπολογιστικό τους φόρτο, συγκαταλέγονται μεταξύ των πιο αξιόπιστων αλγορίθμων, ιδιαίτερα για δύσκολα προβλήματα αναγνώρισης με μικρό μέγεθος δικτύου και μικρά σύνολα δεδομένων.

 

Εκτεταμένα πειράματα εξομοιώσεων δείχνουν ότι η προτεινόμενη μέθοδος είναι 100% επιτυχής, στην επιλογή της σωστής τάξης νευρωνικού μοντέλου και στο ότι προσδιορίζει με ακρίβεια τις παραμέτρους του μοντέλου (βάρη), σε πολύ λίγα βήματα. Είναι αξιοσημείωτο ότι αυτές οι προσεγγίσεις καταλήγουν σε  δίκτυα που μαθαίνουν γρήγορα και είναι σχετικά απλά, τα οποία εκτελούν την εργασία της μάθησης με ακρίβεια. Η μέθοδος είναι εφαρμόσιμη σε on line/προσαρμοστικές λειτουργίες, είναι υπολογιστικά αποδοτική και εύρωστη και μπορεί να πραγματοποιηθεί με μια πολύ δυνατή μορφή παράλληλης επεξεργασίας, γεγονός που την κάνει επιδεκτική σε VLSI υλοποίηση. Επιπλέον, η μέθοδος μπορεί να αντιμετωπίσει το πρόβλημα των αλλαγών στην τάξη του μοντέλου που υποστηρίζει τα δεδομένα οδήγησης, με την έννοια ότι μπορεί να αντιλαμβάνεται τις μεταβολές σε πραγματικό χρόνο και να αυτο-προσαρμόζεται σ’ αυτές.

 

Τέλος, παρουσιάζεται μια εξελικτική μέθοδος για τη βελτιστοποίηση της δομής ενός πλήρως συνδεδεμένου νευρωνικού δικτύου, που είναι μια τροποποίηση αυτής που αναφέρεται στο [19]. Η χρήση ενός πλήρως συνδεδεμένου νευρωνικού δικτύου, καθώς επίσης και συνδέσεων από το επίπεδο εισόδου απ’ ευθείας στο επίπεδο εξόδου, έχει αποδειχθεί  ότι οδηγεί σε νευρωνικά δίκτυα που μαθαίνουν γρηγορότερα και έχουν μικρότερο μέγεθος.

 

Για να ολοκληρωθεί η παρουσίαση των νέων μεθόδων, μερικές όψεις του υπολογιστικού φόρτου των αλγορίθμων έχουν πραγματοποιηθεί. Η ανάλυση παρουσιάζεται με τμηματική (modular) μορφή, στη βάση του νευρώνα. Αν και τα αποτελέσματα που παρουσιάστηκαν παραπάνω αφορούν την παράλληλη υλοποίηση των αλγορίθμων, μπορούν να χρησιμοποιηθούν για την εκτίμηση της απόδοσης του αλγορίθμου για μια συγκεκριμένη υλοποίηση. Επιπλέον δουλειά θα αντιμετωπίσει το χαμηλό ( στο έργο (task)) επίπεδο παράλληλων υλοποιήσεων, καθώς και τις όψεις της αποδοτικότητας του παραλληλισμού. Έτσι, κάτω φράγματα στον αριθμό των επεξεργαστών που χρειάζονται μπορούν να επιτευχθούν, τα οποία είναι μεγάλης πρακτικής σημασίας στους χρήστες και σχεδιαστές των μεθόδων.

 

ΑΡΧΗ ΚΕΦΑΛΑΙΟΥ