20Aug

Η Waymo χρησιμοποιεί τον εξελικτικό ανταγωνισμό για να βελτιώσει τα αυτοοδηγούμενα αυτοκίνητά της

Η διαδικασία εκπαίδευσης της αυτοοδηγούμενης τεχνητής νοημοσύνης είναι σπάνια αποτελεσματική όταν χρειάζεται είτε να χρησιμοποιήσετε τεράστια ποσότητα υπολογιστική ισχύς για την παράλληλη εκπαίδευση των συστημάτων, διαφορετικά οι ερευνητές περνούν χρόνια για να εξαλείψουν τα κακά συστήματα. Waymo μπορεί να έχει μια πιο έξυπνη προσέγγιση: χρησιμοποιήστε τις ίδιες αρχές που καθοδηγούν την εξέλιξη. Η εταιρεία έχει συνεργαζόμενοι με το DeepMind σε μια μέθοδο "Εκπαίδευση βάσει Πληθυσμού" για ανίχνευση πεζών που έχει τα καλύτερα νευρωνικά δίκτυα να προχωρούν όπως κάνουν οι μορφές ζωής στη φυσική επιλογή, εξοικονομώντας χρόνο και προσπάθεια.

Η προσέγγιση έχει τακτικά τα δίκτυα να ανταγωνίζονται μεταξύ τους, με πιο αδύναμα παραδείγματα να αντικαθίστανται από ισχυρότερους «απόγονους» που είναι αντίγραφα των δικτύων με καλύτερη απόδοση με ελαφρώς τροποποιημένες παραμέτρους (όπως ένα παιδί δεν είναι τέλειος κλώνος του μητρική εταιρεία). Αυτό εξαλείφει αυτόματα τα δίκτυα με χαμηλότερη απόδοση, ενώ η Waymo δεν χρειάζεται να επανεκπαιδεύσει τα δίκτυα από την αρχή -- έχουν ήδη κληρονομήσει την τεχνογνωσία από τους γονείς τους.

Υπάρχει κίνδυνος η μέθοδος να εστιάζεται υπερβολικά σε βραχυπρόθεσμες βελτιώσεις. Για να το καταπολεμήσει αυτό, ο Waymo δημιούργησε «κόγχες» όπου τα νευρωνικά δίκτυα προκαλούσαν το ένα το άλλο σε υποομάδες για να αποκτήσουν ισχυρά αποτελέσματα διατηρώντας παράλληλα την ποικιλομορφία που θα μπορούσε να είναι καλύτερα κατάλληλη για οδήγηση στον πραγματικό κόσμο συνθήκες.

Τα αποτελέσματα ήταν ενθαρρυντικά όταν εφαρμόστηκαν στον εντοπισμό πεζών. Η προσέγγιση PBT μείωσε τα ψευδώς θετικά κατά 24 τοις εκατό, παρόλο που χρειάστηκε το μισό χρόνο. Το πείραμα πήγε τόσο καλά που η Waymo χρησιμοποιεί ακόμη και PBT σε άλλα μοντέλα. Αυτό, με τη σειρά του, υπόσχεται αυτοοδηγούμενα αυτοκίνητα που μπορούν να αντιμετωπίσουν καλύτερα την πολυπλοκότητα της οδήγησης και να αποφύγουν συγκρούσεις.