Ο μηχανικός που άφησε το στίγμα του στη δημοφιλέστερη μηχανή αναζήτησης του Παγκόσμιου Ιστού αποσύρεται από την ενεργό δράση στην Κοιλάδα του Πυριτίου. Συμπληρώνοντας θητεία 15 χρόνων ως επικεφαλής του Google Search, ο ινδός Αμίτ Σινγκχάλ παραχωρεί τη θέση του σε έναν άνθρωπο που κατέχει έναν από τους πιο συναρπαστικούς τομείς της σύγχρονης πληροφορικής: τον τομέα των μηχανών που μαθαίνουν. Όταν ο Σινγκχάλ θα επιστρέφει όσα οφείλει στην κοινωνία μέσω φιλανθρωπικής δράσης που δεδηλωμένα θα αναπτύξει, όντας πλέον βαθύπλουτος, ο Τζον Τζιαναντρέα (John Giannandrea) θα αλλάζει τη μηχανή αναζήτησης της Google, μαθαίνοντάς της να μαθαίνει. Από το Μάρτιο του 2016, θα είναι ο νέος επικεφαλής του Google Search, πέντε χρόνια μετά την ανάληψη των καθηκόντων του στον τομέα έρευνας της Google.
Αυτή είναι και η σημαντικότερη πρόκληση που θα αντιμετωπίσει ο Τζιαναντρέα -να βάλει τις μηχανές να δουλέψουν χωρίς κανόνες -μαθαίνοντας από τα δεδομένα, αξιοποιώντας τη μηχανική μάθηση (Machine Learning). Αυτό σημαίνει ότι η μηχανή μπορεί να δρα χωρίς να έχει προγραμματιστεί να δράσει αναλόγως, ακολουθώντας κάποιους προδιαγεγραμμένους κανόνες υπό μορφή αλγορίθμου. Και η μόνη μηχανή που μπορεί να το κάνει αυτό καλά είναι ο ανθρώπινος εγκέφαλος: μέσα σε 100-200 χιλιοστά του δευτερολέπτου μπορεί να αναγνωρίσει, να μοντελοποιήσει και να επεξεργαστεί τεράστιο όγκο δεδομένων.
Οι πρώτες ενδείξεις ότι μπορεί να κατανοηθεί και να μοντελοποιηθεί με επιτυχία η λειτουργία των εγκεφαλικών νευρώνων εμφανίστηκαν μόλις στα τέλη του 20ου αιώνα και τότε άρχισαν εντατικά επιχειρήσεις να τη μιμηθούν. Έτσι εισάγεται στο λεξικό της πληροφορικής ο όρος βαθιά μηχανική μάθηση (deep machine learning), που επιχειρεί περίπλοκες προβλέψεις απευθείας από τα δεδομένα. Σήμερα, που τα δεδομένα είναι πολλά και αυξάνονται με τρομακτικούς ρυθμούς -η ΙΒΜ εκτιμά ότι σήμερα καθημερινά δημιουργούνται 2,5 exabyte δεδομένων (στην κλίμακα MB, GB, TB, PB, EB) και το 2020 θα φτάσουν τα 40 zettabytes (ΕΒ, ΖΒ). H Google έχει στα χέρια της το μεγαλύτερο ίσως όγκο από τα δεδομένα αυτά και δεν έχει άλλο δρόμο παρά να επιχειρήσει να αντλήσει γνώση από αυτά, βασισμένη στις μηχανές που μαθαίνουν να μαθαίνουν.
- Οι τεχνικές της βαθιάς μάθησης επιχειρούν να λύσουν δύσκολα προβλήματα, όπως η αναγνώριση αντικειμένων, η όραση υπολογιστή, η αναγνώριση κειμένου, η μοντελοποίηση γλώσσας, η επεξεργασία φυσικής γλώσσας, η ανάκτηση πληροφορίας και άλλα. Το 2013 χαρακτηρίστηκε ως μια από τις 10 πλέον επαναστατικές τεχνολογίες της χρονιάς.
Μερικά χαρακτηριστικά παραδείγματα όπου χρησιμοποιούνται τεχνικές βαθιάς μηχανικής μάθησης είναι η υπηρεσία φωνητικής αναζήτησης του Bing, της μηχανής αναζήτησης της Microsoft, που έφερε βελτίωση στο ρυθμό σφάλματος αναγνώρισης λέξης της τάξης του 15%. Σε μοντέλα βαθιάς μάθησης βασίζεται και η φωνητική αναγνώριση φυσικής γλώσσας στο Xbox One, οι συστάσεις ταινιών στο Netflix, οι προτάσεις μουσικής στο Spotify, και οι προτάσεις προϊόντων στο Amazon. Η μηχανή αναζήτησης Baidu χρησιμοποιεί τεχνικές βαθιάς μάθησης για να προβάλλει σχετικές διαφημίσεις στους επισκέπτες της, οδηγώντας τη μηχανή σε σημαντική αύξηση των εσόδων της. Η PayPal βασίζεται σε τέτοια μοντέλα για την ανίχνευση επιχειρήσεων ηλεκτρονικής απάτης.
Διαβάστε επίσης
Είναι φανερό ότι η Google έχει πολλά να κερδίσει από τις μηχανές που μαθαίνουν να μαθαίνουν -αν σκεφτεί κανείς ότι το επιχειρηματικό της μοντέλο βασίζεται στην απόδοση των διαφημίσεών της. Όσο καλύτερα κατανοεί η μηχανή της για τι ενδιαφέρεται ο χρήστης, αξιοποιώντας τον πλούτο των δεδομένων που του παραχωρεί ο χρήστης χρησιμοποιώντας δεκάδες υπηρεσίες της Google, τόσο μεγαλύτερη θα είναι η πιθανότητα να του προβάλλει το πλέον κατάλληλο προϊόν, αποφέροντας περισσότερα χρήματα στα ταμεία της.
Δείτε ένα βίντεο της ΙΒΜ για μια εισαγωγή στο Deep Machine Learning:
- Η αναζήτηση εικόνων μπορεί επίσης να βελτιωθεί χάρη στο machine learning, αφού μπορεί όχι μόνο να ταυτοποιήσει πρόσωπα, αλλά και να διακρίνει το φύλο ή την ηλικία τους.
- Στις μηχανές που μαθαίνουν βασίζεται, όπως προαναφέρθηκε και η φωνητική αναζήτηση, ή οι ψηφιακοί βοηθοί όπως η Apple Siri, η Microsoft Cortana, ένας τομέας με εξαιρετικό ενδιαφέρον δεδομένης της διάδοσης των smartphone, και των smartwatch.
- Ή τέλος, η απόδοση ετικετών σε φωτογραφίες και η αναγνώριση του περιεχομένου τους, όπως κτίρια, τοποθεσίες, άνθρωποι και λοιπά, έχουν ιδιαίτερο ενδιαφέρον για το μέλλον της Google.
Τα μοντέλα του ερευνητικού τομέα της Google έχουν ήδη υιοθετηθεί στην υπηρεσία Google Photos -αν και έχουν παράξει αποτελέσματα «που δεν θα ήθελε ποτέ ένας μηχανικός να παραχθούν».
Η μηχανή της Google είναι ήδη μαθητευόμενη και έχει αναλάβει το 15% των ημερήσιων αναζητήσεων και μάλιστα των πλέον δύσκολων, των queries που δεν έχει απαντήσει ξανά.
Η πρόκληση όμως που θα αντιμετωπίσει ο Τζιαναντρέα είναι η απώλεια του πλήρους ελέγχου της μηχανής -συχνά στα μοντέλα αυτά είναι αδύνατο να κατανοηθεί με την αντίστροφη μηχανική πώς λειτούργησε η μηχανή για να παράξει αυτά τα αποτελέσματα, ώστε είτε να υιοθετηθούν οι κανόνες που διέκρινε ότι τα διέπουν και να βελτιωθεί το συνολικό σύστημα, είτε να αλλάξει η «λογική» της και να διορθωθεί.
Πάντως, από τον Οκτώβριο του 2015, η μηχανή της Google έχει το δικό της RankBrain για να ταξινομεί δικτυακούς τόπους -και οι δημιουργοί τους είναι στο έλεός του, με τους μηχανικούς να νίπτουν τα χείρας τους μπροστά σε τυχόν δυσαρεστημένους κατόχους τους ή αρχές προστασίας του υγιούς ανταγωνισμού που ενδέχεται να εκφράσουν τις αντιρρήσεις τους, όπως έχει συμβεί στο παρελθόν όταν υπήρχαν ρητοί, αν και επτασφράγιστοι, κανόνες. Ίσως γιατί, αυτό που δεν μπορούν να κάνουν σήμερα οι μηχανές όπως ο ανθρώπινος νους, δεν θα μπορεί να το κάνει αύριο ο ανθρώπινος νους για τις σκεπτόμενες μηχανές.
In.gr Τεχνολογία