4-1 AlphaGo vs. Λι Σεντόλ
Παρά το γεγονός ότι ο AlphaGo έκανε ένα σημαντικό λάθος στην αρχή της τελευταίας παρτίδας, κατόρθωσε να αντιστρέψει το αποτέλεσμα υπέρ του.
Σε αντίθεση με άλλα προγράμματα Γκο, τα οποία δημιουργήθηκαν ειδικά για να παίζουν το παιχνίδι, ο αλγόριθμος AlphaGo δεν διδάχθηκε καν τους κανόνες του παιχνιδιού -είναι ένας αλγόριθμος μάθησης που βελτιώνεται με την εμπειρία.
Το πρόγραμμα αρχικά μελέτησε 50 εκατομμύρια κινήσεις από παιχνίδια επαγγελματιών παικτών και έμαθε έτσι να προβλέπει ποια είναι η καλύτερη κίνηση. Έπαιξε επίσης εκατομμύρια παρτίδες εναντίον του εαυτού του και διδάχτηκε να εκτιμά ποιος παίκτης έχει το πάνω χέρι υπολογίζοντας την πιθανότητα να κερδίσει τελικά το παιχνίδι η μία ή η άλλη πλευρά.
Το AlphaGo μπορεί να μαθαίνει επειδή βασίζεται σε ένα δίκτυο από εικονικούς νευρώνες που συνδέονται μεταξύ τους με εικονικές συνάψεις, οι οποίες ισχυροποιούνται ή εξασθενίζουν ανάλογα με τα παραδείγματα και την εμπειρία.
Το νευρωνικό δίκτυο βελτιώθηκε, μαθαίνοντας από τις ιδιαίτερες ικανότητες του εξαιρετικού Σεντόλ -έχει αναμετρηθεί δύο πλέον φορές με τον δημιουργό του, τον άνθρωπο -την πρώτη με τον ευρωπαίο πρωταθλητή τον οποίο και νίκησε και τώρα με τον παγκόσμιο πρωταθλητή. Κι αυτό, είναι ιδιαίτερα ενθαρρυντικό, αφού η τεχνητή του νοημοσύνη θα αξιοποιηθεί σε διάφορους κρίσιμους τομείς, όπως είναι η υγεία και η επιστημονική έρευνα γενικότερα.
- Το ταμπλό του Γκο είναι ένας πίνακας με 19 επί 19 τετράγωνα, στα οποία οι δύο παίκτες παίζουν εναλλάξ τοποθετώντας μαύρα ή άσπρα βότσαλα. Κάθε παίκτης προσπαθεί να περικυκλώσει τα πούλια του αντιπάλου του έτσι ώστε να μην υπάρχουν ελεύθερες θέσεις γύρω του. Τα περικυκλωμένα πούλια απομακρύνονται από τον ταμπλό και η τελική βαθμολογία υπολογίζεται από την περιοχή που ελέγχει ο κάθε παίκτης και τον αριθμό των βότσαλων που κατάφερε να φυλακίσει. Σε μια τυπική αναμέτρηση των 150 κινήσεων, οι πιθανές διατάξεις των πετρών στο ταμπλό φτάνει τις 10170 -ένας αριθμός μεγαλύτερος από τον αριθμό όλων των ατόμων στο Σύμπαν που εξηγεί την πρόκληση για ανθρώπους και μηχανές.
Η DeepMind με τον αλγόριθμο AlphaGo κερδίζει χρηματικό έπαθλο ενός εκατομμυρίου δολαρίων.
Η τεχνολογία του AlphaGo, λέει ο δημιουργός του, Ντένις Χασάμπις της DeepMind, θα μπορούσε να αξιοποιηθεί και σε άλλες εφαρμογές που απαιτούν λήψη αποφάσεων, σχεδιασμό στρατηγικής και αναγνώριση περίπλοκων μοτίβων. Παραδείγματα είναι οι αυτόματες διαγνώσεις σε απεικονιστικές εξετάσεις και η βελτίωση των μοντέλων του παγκόσμιου κλίματος.
Η πρώτη μεγάλη νίκη των υπολογιστών έναντι των ανθρώπων ήρθε το 1997, όταν ο υπολογιστής Deep Blue της IBM νίκησε τον τότε παγκόσμιο πρωταθλητή στο σκάκι Γκάρι Κασπάροφ. Έκτοτε οι αλγόριθμοι έχουν κατατροπώσει τους ανθρώπους στη ντάμα, το τάβλι και το τηλεπαιχνίδι Jeopardy!.