O νοτιοκορεάτης Λι Σέντολ χρειάστηκε πέντε ώρες για να πετύχει την πρώτη νίκη του έναντι της μηχανής ,
3-1 το σκορ
Στο ασυνήθιστο τουρνουά που διεξάγεται στη Σεούλ, το AlphaGo παραδέχτηκε την ήττα του απέναντι στο νοτιοκορεάτη Λι Σέντολ πέντε ώρες μετά την έναρξη της αναμέτρησης.
«Η νίκη αυτή είναι τόσο πολύτιμη για μένα που δεν θα την άλλαζα με τίποτα στον κόσμο» σχολίασε ο Λι, ο οποίος έχει στην κατοχή του νίκες σε 18 διεθνή τουρνουά Γκο.
Ο Λι, όμως, έχασε στην πρώτη, τη δεύτερη και την τρίτη αναμέτρηση με τη μηχανή.
Το AlphaGo, ένα «νευρωνικό δίκτυο» που μιμείται την αρχιτεκτονική του εγκεφάλου, αναπτύχθηκε από τη λονδρέζικη εταιρεία DeepMind, η οποία εξαγοράστηκε από τη Google πριν από δύο χρόνια.
Η τεχνολογία του AlphaGo, λέει ο δημιουργός του Ντένις Χασάμπις της DeepMind, θα μπορούσε να αξιοποιηθεί και σε άλλες εφαρμογές που απαιτούν λήψη αποφάσεων, σχεδιασμό στρατηγικής και αναγνώριση περίπλοκων μοτίβων. Παραδείγματα είναι οι αυτόματες διαγνώσεις σε απεικονιστικές εξετάσεις και η βελτίωση των μοντέλων του παγκόσμιου κλίματος.
Το Γκο, το οποίο θεωρείται μακράν πιο περίπλοκο από το σκάκι, εκ πρώτης όψης φαίνεται απλό. Το ταμπλό του είναι ένας πίνακας με 19 επί 19 τετράγωνα, στα οποία οι δύο παίκτες παίζουν εναλλάξ τοποθετώντας μαύρα ή άσπρα βότσαλα. Κάθε παίκτης προσπαθεί να περικυκλώσει τα πούλια του αντιπάλου του έτσι ώστε να μην υπάρχουν ελεύθερες θέσεις γύρω του. Τα περικυκλωμένα πούλια απομακρύνονται από τον ταμπλό και η τελική βαθμολογία υπολογίζεται από την περιοχή που ελέγχει ο κάθε παίκτης και τον αριθμό των βότσαλων που κατάφερε να φυλακίσει.
Σε μια τυπική αναμέτρηση των 150 κινήσεων, οι πιθανές διατάξεις των πετρών στο ταμπλό φτάνει τις 10170 -ένας αριθμός μεγαλύτερος από τον αριθμό όλων των ατόμων στο Σύμπαν. Αυτό σημαίνει ότι θα ήταν πρακτικά αδύνατο να εξετάσει ένας υπολογιστής όλες τις δυνατές κινήσεις και τις εκβάσεις τους.
Σε αντίθεση με άλλα προγράμματα Γκο, τα οποία δημιουργήθηκαν ειδικά για να παίζουν το παιχνίδι, ο αλγόριθμος AlphaGo δεν διδάχθηκε καν τους κανόνες του παιχνιδιού -είναι ένας αλγόριθμος μάθησης που βελτιώνεται με την εμπειρία.
Το πρόγραμμα αρχικά μελέτησε 50 εκατομμύρια κινήσεις από παιχνίδια επαγγελματιών παικτών και έμαθε έτσι να προβλέπει ποια είναι η καλύτερη κίνηση. Έπαιξε επίσης εκατομμύρια παρτίδες εναντίον του εαυτού του και διδάχτηκε να εκτιμά ποιος παίκτης έχει το πάνω χέρι υπολογίζοντας την πιθανότητα να κερδίσει τελικά το παιχνίδι η μία ή η άλλη πλευρά.
Το AlphaGo μπορεί να μαθαίνει επειδή βασίζεται σε ένα δίκτυο από εικονικούς νευρώνες που συνδέονται μεταξύ τους με εικονικές συνάψεις, οι οποίες ισχυροποιούνται ή εξασθενίζουν ανάλογα με τα παραδείγματα και την εμπειρία.
Παρόμοιες τεχνικές θα μπορούσαν να εφαρμοστούν τώρα σε άλλες εφαρμογές που απαιτούν λήψη αποφάσεων, σχεδιασμό στρατηγικής, μακροπρόθεσμο σχεδιασμό και αναγνώριση περίπλοκων μοτίβων.
Η πρώτη μεγάλη νίκη των υπολογιστών έναντι των ανθρώπων ήρθε το 1997, όταν ο υπολογιστής Deep Blue της IBM νίκησε τον τότε παγκόσμιο πρωταθλητή στο σκάκι Γκάρι Κασπάροφ. Έκτοτε οι αλγόριθμοι έχουν κατατροπώσει τους ανθρώπους στη ντάμα, το τάβλι και το τηλεπαιχνίδι Jeopardy!, μεταξύ άλλων.
Επιμέλεια: Βαγγέλης Πρατικάκης
Newsroom ΔΟΛ