#14 - 02/2019
Ίσως να τη θυμάστε, ίσως και όχι. Υπάρχει μια μέθοδος στη στατιστική, αρκετά απλή και διαδεδομένη ώστε συχνά να διδάσκεται ακόμα και στο λύκειο. Πρόκειται για τη λεγόμενη μέθοδο ελαχίστων τετραγώνων. Το πρόβλημα που καλείται να λύσει η εν λόγω μέθοδος είναι το εξής: έστω ότι έχουμε λάβει κάποια δεδομένα από ένα πείραμα ή από μία δειγματοληψία τα οποία σχεδιάζουμε ως σημεία σε ένα επίπεδο με δύο άξονες – τους γνωστούς άξονες x και y – και αυτά τα σημεία φαίνεται να σχηματίζουν μια ευθεία. Ποια ακριβώς όμως θα έπρεπε να είναι αυτή η ευθεία, αν έπρεπε να τη χαράξουμε στο χαρτί, από τη στιγμή που πολλές ευθείες (με κάποιες μικροδιαφορές στην κλίση τους) θα μπορούσαν να ταιριάξουν αρκετά καλά (δηλαδή να είναι αρκετά κοντά) με τα σημεία των δεδομένων; Την απάντηση τη δίνει η μέθοδος ελαχίστων τετραγώνων. Απ’ όλες τις δυνατές ευθείες, θα «πρέπει» να επιλεγεί εκείνη που είναι πιο κοντά στα δεδομένα, με την έννοια ότι, αν μετρήσουμε όλες τις αποστάσεις των σημείων από την ευθεία και μετά τις αθροίσουμε, τότε αυτό το άθροισμα θα πρέπει να είναι το μικρότερο δυνατό σε σχέση με το άθροισμα που θα προέκυπτε επιλέγοντας οποιαδήποτε άλλη ευθεία. [1Στην πραγματικότητα αθροίζονται τα τετράγωνα των αποστάσεων, εξ ου και ο όρος «ελαχίστων τετραγώνων».]
Η σημασία μιας τέτοιας μεθόδου ταιριάσματος μιας ευθείας (επί της ουσίας μιας εξίσωσης) σε κάποια πειραματικά δεδομένα έγκειται στο ότι δίνει τη δυνατότητα της «πρόβλεψης». Αν, για παράδειγμα, τα δεδομένα αφορούν στο ύψος (στον x άξονα) ενός δείγματος ανθρώπων σε σχέση με το βάρος τους (στον y άξονα) τότε η ευθεία που προκύπτει συνιστά κι ένα στατιστικό μοντέλο της εξάρτησης του βάρους από το ύψος. Σε περίπτωση που μετρήσουμε το ύψος ενός ανθρώπου χωρίς να γνωρίζουμε το βάρος του (και χωρίς αυτό το νέο δείγμα-άνθρωπος να υπάρχει ήδη στα αρχικά μας δεδομένα), τότε μπορούμε να χρησιμοποιήσουμε την ευθεία που έχουμε ήδη εξαγάγει για να «προβλέψουμε» ποιο περίπου θα είναι το βάρος του. Εφόσον ξέρουμε σε ποιο x-ύψος πέφτει το νέο δείγμα, μπορούμε να βρούμε το σημείο της ευθείας που του αντιστοιχεί κι από εκεί να βρούμε και το y-βάρος.
Η μέθοδος ελαχίστων τετραγώνων. Οι γραμμές που συνδέουν τα κουτάκια με την ευθεία είναι οι αποστάσεις. Αθροίζοντας αυτές τις αποστάσεις, παίρνουμε τη συνολική απόσταση των σημείων από την ευθεία. Η καλύτερη ευθεία είναι αυτή που έχει τη μικρότερη συνολική απόσταση από τα σημεία – τετράγωνα.
Πρόκειται για μια εξαιρετικά απλή μέθοδο που προφανώς προγραμματίζεται πολύ εύκολα σε έναν υπολογιστή. Αν, τώρα, έβγαινε κάποιος μεγαλόσχημος επιστήμονας και πομπωδώς ανακοίνωνε ότι ένας υπολογιστής προγραμματισμένος να εκτελεί τη μέθοδο ελαχίστων τετραγώνων αποτελεί δείγμα τεχνητής νοημοσύνης, δικαίως θα ανέμενε κανείς μια χιονοστιβάδα χλευαστικών σχολίων ως αντίδραση. Κι όμως, με μια (μικρή) δόση υπερβολής, αυτό ακριβώς συμβαίνει τα τελευταία χρόνια με τη λεγόμενη αναγέννηση της μηχανικής μάθησης. Χωρίς όμως κάποια αντίδραση! Αφού η Google μπορεί αυτόματα να αναγνωρίζει γατάκια σε βίντεο του youtube, ε, κάποια «νοημοσύνη» θα πρέπει να υπάρχει από πίσω. Όποιος όμως έχει καταλάβει τη λογική της μεθόδου ελαχίστων τετραγώνων, έχει ήδη κατανοήσει και ένα τεράστιο κομμάτι από τον πυρήνα αυτού που λέγεται μηχανική μάθηση κι έχει κάνει ένα καλό βήμα προς την απομυστικοποίησή της. Οι μέθοδοι μηχανικής μάθησης στοχεύουν ακριβώς στην εξαγωγή στατιστικών μοντέλων από δεδομένα, υπό τη μορφή καμπυλών συσχέτισης ορισμένων μεταβλητών με κάποιες άλλες. Η διαφορά σε σχέση με την απλή μέθοδο ελαχίστων τετραγώνων δεν είναι ποιοτική, αλλά διαφορά στον βαθμό πολυπλοκότητας. Τα πιο εξελιγμένα μοντέλα μηχανικής μάθησης, όπως τα περίφημα νευρωνικά δίκτυα, έχουν τη δυνατότητα εξαγωγής περίπλοκων καμπυλών (και όχι μόνο απλών ευθειών) που μπορούν να συσχετίζουν εκατοντάδες ή και χιλιάδες μεταβλητές (και όχι μόνο δύο)· κάτι που φυσικά απαιτεί μαθηματικά εργαλεία αρκετά πιο εξελιγμένα. Στον πυρήνα τους όμως κάνουν ακριβώς το ίδιο: βρίσκουν καμπύλες που ταιριάζουν όσο το δυνατόν καλύτερα σε κάποια δεδομένα ώστε να μπορούν να προβλέψουν την τιμή κάποιων μεταβλητών σε νέα δεδομένα που δεν έχουν ξαναδεί.
Η καχυποψία απέναντι στα ιδεολογήματα που συστηματικά παράγει ο χώρος της τεχνητής νοημοσύνης, όσο και η κριτική αποδόμησή τους, αποτελούν βασικά καθήκοντα μιας σκέψης που διεκδικεί να παραμείνει ανταγωνιστική. Στο βαθμό ωστόσο που τέτοιες κριτικές απόπειρες παραμένουν σε ένα επίπεδο αμιγώς φιλοσοφικό (επιχειρώντας να δείξουν γιατί η τεχνητή νοημοσύνη μπορεί να μην είναι εν τέλει και τόσο νοήμων [2Κάπου εκεί εξαντλούν την κριτική τους πολλά από τα έργα γνωστών φιλοσόφων που εναντιώνονται στη δυνατότητα μιας πραγματικής τεχνητής νοημοσύνης, με τυπικά παραδείγματα αυτά των Hubert Dreyfus και John Searle.]) διατρέχουν τον κίνδυνο να παραβλέψουν αυτό που μπορεί να είναι εξίσου ή ακόμα πιο βαρύνουσας σημασίας. Η τεχνητή νοημοσύνη, ακόμα κι αν της αρνηθεί κανείς τις ιδιότητες μιας «πραγματικής» νοημοσύνης, συνιστά έναν από τους βασικούς βραχίονες της τρέχουσας αναδιάρθρωσης του καπιταλισμού προς το μοντέλο της καθολικής μηχανικής διαμεσολάβησης. Κι ως τέτοια, θα πρέπει να λαμβάνεται σοβαρά υπόψιν, ακόμα κι αν οι έριδες περί του βαθμού «πραγματικότητάς» της δεν καταλαγιάσουν ποτέ.
Πριν μιλήσει κανείς για την πραγματικότητα ή μη της όποιας κατασκευασμένης, τεχνητής νοημοσύνης, θα έπρεπε να υπάρχει μια κατ’ αρχήν συμφωνία μεταξύ των εμπλεκομένων επιστημόνων σχετικά με το ίδιο το αντικείμενο που πραγματεύεται ο κλάδος τους. Αυτό τουλάχιστον υποτίθεται ότι επιτάσσει η πολιτική ορθότητα της επιστημονικής πρακτικής· κι ένας αδαής, κοιτώντας απ’ έξω, θα περίμενε ότι αυτό θα ήταν ένα ξεκαθαρισμένο ζήτημα. Φευ! Η τεχνητή νοημοσύνη κατέχει την «αξιοζήλευτη» θέση να είναι μια επιστήμη με το διπλό πρόσωπο του Ιανού. Φυλλομετρώντας ένα εκλαϊκευτικό βιβλίο γύρω από το θέμα, [3Τυπικό παράδειγμα είναι το (ομολογουμένως κάπως παλιό) βιβλίο του John Haugeland, Τεχνητή νοημοσύνη, εκδ. Κάτοπτρο.] θα δει κανείς να παρελαύνουν βαριά ονόματα από την ιστορία της δυτικής φιλοσοφίας και μεγαλεπήβολες ιδέες για μηχανές με την ικανότητα να «σκέφτονται». Σχεδόν σαν να πρόκειται για έναν κλάδο εφαρμοσμένης φιλοσοφίας με τον φιλόδοξο στόχο να ξεδιαλύνει επιτέλους τα μυστήρια της νόησης. Αντίθετα, σε ένα τεχνικό εγχειρίδιο τεχνητής νοημοσύνης που έχει ως στόχο να εκπαιδεύσει νέους επιστήμονες πάνω σε πραγματικές εφαρμογές της, [4Κλασσικό τέτοιο εγχειρίδιο είναι το βιβλίο των Russel και Norvig, Artificial intelligence: a modern approach.] οι φιλόσοφοι μετά βίας βρίσκουν μια κάποια θέση, υπό τη μορφή σύντομων ιστορικών υποσημειώσεων. Στην πρώτη γραμμή βρίσκονται τεχνικές για πώς ένας υπολογιστής μπορεί να ψάχνει αποδοτικά όλες τις δυνατές κινήσεις σε παιχνίδια σαν το σκάκι, για το πώς στατιστικές μέθοδοι (σαν αυτή που περιγράψαμε) μπορούν να αποτελέσουν τη βάση για συστήματα αυτόματης διάγνωσης ασθενειών ή για την κατηγοριοποίηση εικόνων κ.ο.κ. Οι αναφορές σε μηχανές που «πραγματικά σκέφτονται» φυσικά δεν λείπουν· σε καμία περίπτωση όμως δεν κατέχουν κεντρική θέση και διατυπώνονται με μια (πολύ) συγκρατημένη αισιοδοξία.
Εδώ δεν πρόκειται (μόνο) για το σύνηθες χάσμα ανάμεσα στην εκλαϊκευμένη παρουσίαση μιας επιστήμης, που κατ’ ανάγκη κινείται σε ένα πιο υψηλό επίπεδο αφαίρεσης, και στα πιο δύσβατα τεχνικά περιεχόμενά της που αφορούν σχεδόν κατ’ αποκλειστικότητα τους ειδικούς. Είναι μια πραγματικά σχιζοειδής κατάσταση που ταλαιπωρεί την τεχνητή νοημοσύνη εδώ και δεκαετίες· με την πάθηση μάλιστα να έχει βρει και όνομα στην αντιδιαστολή μεταξύ γενικής (artificial general intelligence ή strong AI) και στενής τεχνητής νοημοσύνης (narrow ή weak ΑΙ). Η πρώτη (υποτίθεται ότι) ασχολείται με τα μεγάλα φιλοσοφικά ερωτήματα περί νόησης και σκέψης και σκοπός της είναι η κατασκευή πραγματικά σκεπτόμενων μηχανών. Στην πράξη, τα αποτελέσματα που έχει να επιδείξει μέχρι τώρα είναι πενιχρά. Η δεύτερη έχει πιο ταπεινές φιλοδοξίες και περιορίζεται στην κατασκευή μηχανών που εστιάζουν στην επίλυση συγκεκριμένων προβλημάτων (π.χ., να παίζουν σκάκι), αδιαφορώντας επί της ουσίας για το αν ο τρόπος με τον οποίο βρίσκουν λύσεις έχει κάποια σχέση με τις ανθρώπινες νοητικές ικανότητες. Με ταπεινές φιλοδοξίες μεν, αλλά με αξιοσημείωτα και χειροπιαστά βήματα προόδου, ειδικότερα τα τελευταία χρόνια.
Είναι εύκολο να δημιουργηθεί η εντύπωση ότι η διάκριση ανάμεσα σε ασθενή και γενική τεχνητή νοημοσύνη αντιστοιχεί και σε μία διάκριση μεταξύ «σοβαρών» επιστημόνων που ασχολούνται με πρακτικά προβλήματα και «ανάλαφρων» ερευνητών που έχουν μπερδέψει τη στιβαρή επιστημονική δουλειά με ιδεολογήματα περί σκεπτόμενων μηχανών. Θα αρκούσε επομένως να ξεφορτωθούμε τους αιθεροβάμονες για να κρατήσουμε καθαρό τον κλάδο της τεχνητής νοημοσύνης. Η ίδια η ιστορία της τεχνητής νοημοσύνης όμως υποδεικνύει μια διαφορετική και σαφώς πιο σύνθετη ερμηνεία κατά την οποία υπήρξαν και πολιτικοί λόγοι (με την ευρεία έννοια) πίσω από τη διάνοιξη αυτού του χάσματος.
Ως όρος, η τεχνητή νοημοσύνη φαίνεται ότι πρωτοεμφανίστηκε γύρω στα μέσα της δεκαετίας του 50, λίγο μετά την εμφάνιση των ίδιων των ηλεκτρονικών υπολογιστών. Ως ιδέα όμως, η επιθυμία για κατασκευή μηχανών με κάποιες δυνατότητες σκέψης – ή διαφορετικά ειπωμένο, η επιθυμία για τη μηχανοποίηση της σκέψης – έχει μια μακρά ιστορία και μπορεί να ανευρεθεί ήδη στα οράματα του Leibniz για μια καθολική άλγεβρα της σκέψης (calculus rationicator) και για μηχανές που θα μπορούσαν να αποφανθούν επί οποιουδήποτε ζητήματος, χρησιμοποιώντας τους κανόνες αυτής της άλγεβρας. [5Βλ. Sarajevo, Τετράδια για εργατική χρήση νο 3, Η μηχανοποίηση της σκέψης. Για μια κατατοπιστική, αλλά συμβατική ιστορία της τεχνητής νοημοσύνης βλ. επίσης το βιβλίο της Pamela McCorduck, Machines who think (Η χρήση της αντωνυμίας who στον τίτλο, που χρησιμοποιείται αποκλειστικά για πρόσωπα και όχι για πράγματα, προφανώς δεν είναι τυχαία). Για μια γενεαλογία της έννοιας της νοημοσύνης, βλ. Cyborg, τ. 8, το τεστ Turing: σημειώσεις για μια γενεαλογία της «νοημοσύνης».] Τα οράματα του Leibniz και των επιγόνων του (όπως του Babbage) παρέμειναν ωστόσο για αιώνες ακριβώς αυτό: οράματα που στην καλύτερη περίπτωση έφταναν μέχρι την κατασκευή κάποιων πρωτοτύπων. Έπρεπε να περιμένουν τους ηλεκτρονικούς υπολογιστές για να βρουν μια κάπως πιο πειστική έκφραση στο πρακτικό επίπεδο. Αν και οι υπολογιστές περιορίζονταν αρχικά στην εκτέλεση μαθηματικών υπολογισμών σε μαζική κλίμακα για την επίλυση περίπλοκων εξισώσεων, υπήρξαν παρ’ όλα αυτά κάποιοι πιο διορατικοί επιστήμονες (όπως ο γνωστός Turing) που διείδαν από την αρχή την ικανότητά τους για λογικό χειρισμό συμβόλων σε ένα πιο αφηρημένο επίπεδο. Αυτό που πραγματικά φάνηκε να πείθει εν τέλει πολλούς για το βάσιμο της υπόθεσης περί μιας πραγματικής αντιστοιχίας ανάμεσα στις διαδικασίες της σκέψης και στις λειτουργίες του υπολογιστή ήταν μια απλή (ως απλοϊκή) παρατήρηση νευροβιολογικής φύσης: αν οι νευρώνες λειτουργούν μεταδίδοντας ηλεκτρικούς παλμούς, τότε αυτοί οι παλμοί μπορούν να ερμηνευτούν ως τα ψηφιακά 0 και 1 των υπολογιστών κι επομένως ο εγκέφαλος, ως έδρα της νόησης, ακολουθεί κι αυτός τις λειτουργικές αρχές των υπολογιστών, ασχέτως αν αυτές οι αρχές υλοποιούνται σε ένα βιολογικό και όχι ηλεκτρονικό υπόστρωμα. Από τη στιγμή που είναι δυνατό να εντοπιστεί μια τέτοια τυπική, λειτουργική ισοδυναμία μεταξύ εγκεφάλου και υπολογιστή, το υλικό υπόστρωμα καθίσταται λίγο – πολύ αδιάφορο και ανοίγει ο δρόμος για την αφηρημένη μελέτη της νόησης και την κατασκευή (μη βιολογικών) μηχανών με νοητικές ικανότητες.
Είναι μάλλον προφανές ότι η παραπάνω συλλογιστική που καταλήγει σε μια καταφατική απάντηση στο ερώτημα περί σκεπτόμενων μηχανών έχει αρκετά τρωτά σημεία· όπως η αξιωματική παραδοχή για τη σκέψη ως χειρισμό συμβόλων και η απλοϊκή αναγωγή της νευρωνικής δραστηριότητας σε on-off διακόπτες. Θα προσπεράσουμε αυτό το σημείο για να σταθούμε σε κάτι άλλο, πιο σχετικό με τους σκοπούς μας εδώ. Η διάκριση ανάμεσα σε γενική και ασθενή τεχνητή νοημοσύνη όχι μόνο δεν υπήρχε εξαρχής, αλλά αντιθέτως το βασικό ζητούμενο ήταν η μηχανοποίηση της «πραγματικής» σκέψης, η κατασκευασμένη νοημοσύνη στη γενική της μορφή. Δεν ήταν μάλιστα σπάνιες οι μεγαλόστομες δηλώσεις που προέβλεπαν ότι η κατασκευή νοημόνων μηχανών ήταν ζήτημα μιας – δύο δεκαετιών (και σίγουρα τέτοιες δηλώσεις δεν εκλαμβάνονταν ως προκλητικές). Η διάκριση ανάμεσα σε γενική και ασθενή τεχνητή νοημοσύνη επήλθε σταδιακά όταν και έγινε αντιληπτό (εκ των έσω) κατά τα τέλη της δεκαετίας του 70 ότι οι αρχικές υποσχέσεις ήταν υπερφιλόδοξες και δεν επρόκειτο να εκπληρωθούν. Ήταν η εποχή του πρώτου «χειμώνα της τεχνητής νοημοσύνης». Επί της ουσίας, η διάκριση αυτή ήταν μια στρατηγική άμυνας των ερευνητών απέναντι σε κατηγορίες για διασπάθιση χρήματος σε άνευ πρακτικού αποτελέσματος έρευνες. Για να διασωθούν, αναγκάστηκαν να αναδιπλωθούν στο πιο στενάχωρο πεδίο της στενής τεχνητής νοημοσύνης.
Υπάρχει και μια άλλη διάσταση του ζητήματος, λιγότερη προφανής, αλλά ίσως πιο βαρύνουσας σημασίας: η ανάδυση της τεχνητής νοημοσύνης τη στιγμή της ταυτόχρονης εμφάνισης της κυβερνητικής και της θεωρίας των συστημάτων. Ως καθολική θεωρία, η κυβερνητική φιλοδοξούσε να συμπεριλάβει σε ένα ενιαίο μαθηματικό σχήμα ολόκληρο το φάσμα της πραγματικότητας, από την ανόργανη ύλη μέχρι τους έμβιους οργανισμούς. Πιο συγκεκριμένα, δεν ήταν το οποιοδήποτε τμήμα της ανόργανης ύλης στο στόχαστρό της, αλλά κατά κύριο λόγο οι ίδιες οι μηχανές. Και το διακύβευμα ήταν η σύμφυση των μηχανών με τους έμβιους οργανισμούς (κατά βάση τους ανθρώπους) μέσα σε ένα σχέδιο καθολικής διακυβέρνησης – η ετυμολογική συγγένεια των λέξεων «κυβερνητική» και «διακυβέρνηση» δεν είναι σύμπτωση.[6Οι τίτλοι των βιβλίων του Norbert Wiener, ενός εκ των θεμελιωτών της κυβερνητικής, είναι εύγλωττοι: Cybernetics: Or Control and Communication in the Animal and the Machine (1948), The Human Use of Human Beings (1950). ] Η έννοια της ανάδρασης υπήρξε εδώ το βασικό εργαλείο για την επίτευξη αυτής της σύμφυσης, τουλάχιστον σε ένα θεωρητικό, μαθηματικό επίπεδο, ακριβώς λόγω της ομοιότητάς της με την έννοια των σκοπών που επιδεικνύουν οι έμβιοι οργανισμοί στη συμπεριφορά τους. Μια μηχανή με μηχανισμούς ανάδρασης θα μπορούσε επομένως να επιδεικνύει ένα είδος ένσκοπης και αποβλεπτικής συμπεριφοράς, όπως ακριβώς οι έμβιοι οργανισμοί, κι επομένως να αποτελέσει και μοντέλο περιγραφής αυτών των οργανισμών. Και σε ένα επόμενο βήμα, θα άνοιγε ο δρόμος για την επικοινωνία μηχανών – ανθρώπων μέσα σε ένα υπερσύστημα μηχανισμών ανάδρασης, αλλά και για τον αυτόματο έλεγχο του συστήματος προς συγκεκριμένους σκοπούς, μέσω της κατάλληλης προσαρμογής αυτών των βρόχων ανάδρασης. Η τεχνητή νοημοσύνη ήταν ακριβώς μια ένδειξη προς το εφικτό της κατασκευής υπερσυστημάτων ανάδρασης, εφόσον μια σκεπτόμενη μηχανή μπορούσε να μαθαίνει από τα ερεθίσματα του περιβάλλοντός της και να αναπροσαρμόζει τη συμπεριφορά της στη βάση νέων δεδομένων. [7Ένα απλοϊκό παράδειγμα θα ήταν και η μέθοδος ελαχίστων τετραγώνων (αν και δεν περιλαμβάνει ακριβώς μηχανισμό ανάδρασης με την αυστηρή έννοια). Αν έρθουν καινούρια δεδομένα σε ένα «σύστημα ελαχίστων τετραγώνων», τότε αυτό μπορεί να ξανατρέξει τους υπολογισμούς του ώστε να αναπροσαρμόσει την ευθεία (να «μάθει» τη νέα ευθεία) με βάση αυτά τα νέα δεδομένα.]
Αυτό είναι ένα σημείο που θα συναντήσουμε και παρακάτω. Για την ώρα αρκεί να κρατήσουμε το εξής. Η τεχνητή νοημοσύνη είναι ένας κλάδος κατάφορτος πολιτικών και κοινωνικών σημασιών κι έχει υπάρξει τέτοιος από τη γέννησή της. Κάτι που βέβαια ισχύει και για άλλες επιστήμες (ακόμα και για τη φυσική και τα μαθηματικά), ακόμα κι αν αυτό δεν είναι τόσο προφανές, λόγω της ωριμότητάς τους και της χρονικής απόστασης που μας χωρίζει από τη δική τους γέννηση. Το ιδιάζον χαρακτηριστικό της τεχνητής νοημοσύνης ωστόσο είναι ότι πρόκειται επί της ουσίας για έναν κλάδο με τόσο ασαφώς ορισμένο αντικείμενο ώστε θα μπορούσε να χαρακτηριστεί και ως επιστήμη άνευ αντικειμένου. Αυτό που φαίνεται να την ορίζει και να την οριοθετεί πιο συγκεκριμένα δεν είναι τόσο το αντικείμενό της όσο ο σκοπός της: η κατασκευή μηχανών που επιδεικνύουν προσαρμοστική συμπεριφορά.
Αναφερθήκαμε ήδη στον λεγόμενο «πρώτο χειμώνα της τεχνητής νοημοσύνης», στην εποχή εκείνη της παρακμής κατά τη δεκαετία του 70 όταν η έρευνα γύρω από την τεχνητή νοημοσύνη στέρεψε από κονδύλια. Για να υπήρξε ένας πρώτος χειμώνας, αυτό σημαίνει ότι θα πρέπει να υπήρξε και κάποιος επόμενος. Όντως, μετά από μια σύντομη ανάκαμψη, επήλθε ξανά μια απότομη πτώση κατά τα τέλη της δεκαετίας του 80 που αυτή τη φορά κράτησε πολύ περισσότερο· επί της ουσίας μέχρι τις αρχές του 21ου αιώνα, παρά τις κάποιες σποραδικές επιτυχίες στο ενδιάμεσο. Πρόκειται επομένως για ένα επαναλαμβανόμενο μοτίβο: φάσεις υπεραισιοδοξίας και αυξημένων ροών κονδυλίων, ακολουθούμενες από φάσεις κατήφειας και ακύρωσης χρηματοδοτικών προγραμμάτων. Τη στιγμή που γράφεται αυτό το κείμενο, θεωρείται πλέον αναμφισβήτητο ότι η τεχνητή νοημοσύνη βρίσκεται σε φάση αναγέννησης και μάλιστα με καθεστωτική βούλα, εφόσον έχει βρει μια θέση βασικού πυλώνα για την εν εξελίξει 4η βιομηχανική επανάσταση. Έχει σημασία όμως να κατανοήσει κανείς τα ιδιαίτερα χαρακτηριστικά αυτής της αναγέννησης.
Από μια μακροσκοπική οπτική, η τεχνητή νοημοσύνη χωρίζεται σε δύο κατηγορίες: στις συμβολικές και στις συνδετιστικές (connectionist) προσεγγίσεις. Οι μεν πρώτες εστιάζουν στην κατασκευή συστημάτων που δουλεύουν στη βάση κανόνων μαθηματικής λογικής, της μορφής «αν άνθρωπος, τότε θνητός». Δίνοντάς τους κάποια δεδομένα υπό τη μορφή λογικών γεγονότων, π.χ., «Σωκράτης άνθρωπος», έχουν τη δυνατότητα να ακολουθήσουν μια αλυσίδα συλλογισμών και να καταλήξουν σε συμπεράσματα, της μορφής «Σωκράτης θνητός» - κάτι που επιτυγχάνουν ψάχνοντας μηχανικά ποιοι κανόνες ταιριάζουν στα αρχικά δεδομένα και στα ενδιάμεσα συμπεράσματα. Οι δε δεύτερες αναφέρονται στα λεγόμενα τεχνητά νευρωνικά δίκτυα, εμπνευσμένα, όπως υπονοεί και το όνομα, από τα δίκτυα πραγματικών, βιολογικών νευρώνων του εγκεφάλου, αν και σε εξαιρετικά απλοποιημένη μορφή. [8Δεν υπάρχει νευροβιολόγος σήμερα που να πιστεύει σοβαρά ότι τα τεχνητά νευρωνικά δίκτυα έχουν την οποιαδήποτε εξηγητική αξία όσον αφορά στη μελέτη πραγματικών εγκεφάλων. Τα μοντέλα νευρωνικών δικτύων που χρησιμοποιούν στις δικές τους προσομοιώσεις είναι εξαιρετικά πιο περίπλοκα από τα τεχνητά νευρωνικά δίκτυα. ] Κατά βάση πρόκειται για δίκτυα κόμβων σε αλλεπάλληλα επίπεδα όπου οι κόμβοι ενός επιπέδου συνδέονται με αυτούς του επομένου μέσω ακμών. Κάθε κόμβος αθροίζει τα «δυναμικά» όλων των εισερχόμενων σε αυτών ακμών κι αν αυτό το άθροισμα υπερβεί ένα κατώφλι, τότε στέλνει προς τις εξερχόμενες ακμές του ένα σήμα. Το σήμα αυτό μεταβιβάζεται στους κόμβους του επόμενου επιπέδου και η ίδια διαδικασία επαναλαμβάνεται από την αρχή. Όσο περίπλοκα κι αν φαίνονται τα νευρωνικά δίκτυα σε μια πρώτη ανάγνωση, δεν είναι τίποτα άλλο παρά μια πιο εξελιγμένη εκδοχή της μεθόδου ελαχίστων τετραγώνων. [9Προς αποφυγή παρεξηγήσεων, αναφέρουμε (ξανά) ότι τα νευρωνικά δίκτυα δεν είναι μη αλγοριθμικά μοντέλα. Απλώς λειτουργούν σε ένα πιο χαμηλό επίπεδο αφαίρεσης όπου τα σύμβολά τους δεν έχουν άμεση αντιστοίχηση σε αυτό που ένας άνθρωπος θα κατανοούσε πιο άμεσα ως σύμβολα, όπως συμβαίνει με τα συμβολικά συστήματα. Παραμένουν ωστόσο αλγοριθμικά μοντέλα χειρισμού συμβόλων.] Ο σκοπός τους είναι ακριβώς το να «μάθουν» μια καμπύλη ξεκινώντας από κάποια αρχικά δεδομένα. Για παράδειγμα, σε μια εφαρμογή αναγνώρισης εικόνων, η είσοδος στο πρώτο επίπεδο ενός νευρωνικού δικτύου θα μπορούσε να είναι τα πίξελ (η χρωματική διαβάθμισή τους) μιας εικόνας και η έξοδος ένα σημείο πάνω σε μια καμπύλη· αν το σημείο αυτό πέφτει πιο κοντά σε σημεία που συνήθως προκύπτουν από εικόνες σκύλων, τότε το δίκτυο θα «απαντήσει» ότι και η καινούρια εικόνα είναι ένας σκύλος.
Οι συμβολικές προσεγγίσεις και οι παραλλαγές τους υπήρξαν αρκετά κυρίαρχες στο παρελθόν, σε βαθμό που ακόμα και σήμερα ο όρος τεχνητή νοημοσύνη, με την πιο τεχνική του έννοια, να παραπέμπει κυρίως σε αυτές: σε συστήματα με την ικανότητα για κάποιο είδος λογικού συμπερασμού. Η σημερινή αναγέννηση της τεχνητής νοημοσύνης όμως οφείλεται σε μεγάλο βαθμό σε αυτόν τον «μικρό» υποκλάδο της που λέγεται τεχνητά νευρωνικά δίκτυα. [10Η διάκριση ανάμεσα σε συμβολικές και συνδετιστικές προσεγγίσεις δεν έχει σήμερα την ίδια βαρύτητα που είχε στο παρελθόν, από τη στιγμή που τείνουν να ενωθούν. Υπάρχουν πλέον νευρωνικά δίκτυα με την ικανότητα να αναπαριστούν στους κόμβους τους λογικά κατηγορήματα. Υπάρχουν επίσης και άλλες μέθοδοι, με αξιοσημείωτη επιτυχία σε κάποιους τομείς, που όμως δεν είναι εύκολα κατηγοριοποιήσιμες είτε ως συμβολικές είτε ως συνδετιστικές. Η αιχμή του δόρατος πάντως παραμένουν τα νευρωνικά δίκτυα.] Και στις εντυπωσιακές τους ικανότητες για μηχανική μάθηση, αν και η μηχανική μάθηση δεν είναι αποκλειστικό προνόμιο των νευρωνικών δικτύων. Οποιοσδήποτε αλγόριθμος μπορεί να μάθει από δεδομένα κάποια μοτίβα και να χρησιμοποιήσει αυτά τα μοτίβα για να χειριστεί νέα δεδομένα ανήκει στην κατηγορία της μηχανικής μάθησης. Κάτι που είναι εφικτό ακόμα και στις συμβολικές προσεγγίσεις, δια της μεθόδου της επαγωγής. Αν υπάρχουν πολλά δεδομένα της μορφής «Χ άνθρωπος», «Χ θνητός» (όπου εδώ Χ μπορεί να είναι Σωκράτης, Πλάτωνας κ.ο.κ.), τότε ένα συμβολικό σύστημα μηχανικής μάθησης μπορεί τελικά να μάθει τον κανόνα «αν άνθρωπος, τότε θνητός». Τα νευρωνικά δίκτυα από την άλλη μαθαίνουν μεταβάλλοντας τα βάρη των ακμών που συνδέουν τους κόμβους, ρυθμίζοντας έτσι την ένταση των σημάτων που διατρέχουν τους κόμβους. Αν και λιγότερο διαισθητική, αυτή η μέθοδος έχει αποδειχτεί τελικά πολύ πιο αποτελεσματική· είναι πιο εύκολο (τουλάχιστον προς το παρόν) για ένα νευρωνικό να αναλύει εικόνες και με βάση τις καμπύλες που εξάγει να συμπεραίνει αν μια εικόνα περιέχει έναν σκύλο ή ένα κοράκι παρά για ένα συμβολικό σύστημα να μαθαίνει κανόνες του τύπου «αν έχει φτερά, τότε κοράκι». Ανεξαρτήτως της προσέγγισης πάντως, σχεδόν όλες οι τεχνικές μηχανικής μάθησης που λειτούργησαν ως καταλύτης για την αναβίωση της τεχνητής νοημοσύνης έχουν ένα κοινό: ως υπόβαθρό τους έχουν κάποια στατιστικά μοντέλα ανεύρεσης μοτίβων στα δεδομένα (π.χ. το πόσο συχνά εμφανίζεται το ζεύγμα «Χ άνθρωπος», «Χ θνητός» ή το πόσο συχνά οι εικόνες από κοράκια έχουν όλα τα πίξελ τους μαύρα).
Παράδειγμα ενός νευρωνικού δικτύου με ένα επίπεδο εισόδου, ένα εξόδου κι ένα ενδιάμεσο. Τα δημοφιλή βαθιά νευρωνικά δίκτυα απλώς έχουν περισσότερα ενδιάμεσα επίπεδα.
Ο τρόπος με τον οποίο μαθαίνουν τα νευρωνικά δίκτυα είναι με το να μεταβάλλουν την «ένταση» των συνάψεων (w) μεταξύ των κόμβων.
Το ερώτημα ωστόσο παραμένει. Πού οφείλεται η σημερινή ανάκαμψη της τεχνητής νοημοσύνης γενικά και των νευρωνικών δικτύων ειδικότερα; Αντιγράφουμε από άρθρο του Economist: [11Why artificial intelligence is enjoying a renaissance]
«Τα πράγματα έχουν αλλάξει τα τελευταία χρόνια, για τρεις λόγους [σ.τ.μ. προηγουμένως είχε γίνει αναφορά στους χειμώνες της τεχνητής νοημοσύνης]. Πρώτον, νέες τεχνικές μάθησης κατέστησαν δυνατή την εκπαίδευση βαθέων νευρωνικών δικτύων [σ.τ.μ. τα βαθιά νευρωνικά (deep neural networks) δεν είναι τίποτα άλλο παρά νευρωνικά δίκτυα με πολλά επίπεδα κόμβων]. Δεύτερον, μέσω της διάδοσης του διαδικτύου, δισεκατομμύρια εγγράφων, εικόνων και βίντεο έγιναν διαθέσιμα ως δεδομένα εκπαίδευσης. Κάτι που όμως απαιτεί υψηλή υπολογιστική ισχύ· κι εδώ είναι που υπεισέρχεται ο τρίτος παράγοντας: γύρω στο 2009, διάφορες ομάδες ερευνητών της τεχνητής νοημοσύνης αντιλήφθηκαν ότι οι κάρτες γραφικών, εκείνα τα εξειδικευμένα τσιπάκια των προσωπικών υπολογιστών και των παιχνιδομηχανών που είναι υπεύθυνα για τη δημιουργία εντυπωσιακών γραφικών, ήταν κατάλληλες και για τη μοντελοποίηση νευρωνικών δικτύων.
...
Χρησιμοποιώντας βαθύτερα δίκτυα, περισσότερα δεδομένα εκπαίδευσης και νέο, ισχυρότερο hardware, τα βαθιά νευρωνικά δίκτυα (ή συστήματα «βαθιάς μάθησης») άρχισαν ξαφνικά να κάνουν γρήγορα βήματα προόδου σε τομείς όπως η αναγνώριση φωνής, η κατηγοριοποίηση εικόνων και η μετάφραση.»
Παρά την ευλογοφάνειά της, υπάρχει κάτι το επιφανειακό σε αυτή τη γραμμή αιτιολόγησης. Τα βαθιά νευρωνικά δίκτυα δεν συνιστούν κάποια ιδιαίτερη καινοτομία. Η χαμηλή υπολογιστική ισχύς μπορεί όντως να αποτελεί έναν περιοριστικό παράγοντα για την χρήση τους· όσο πιο πολλά επίπεδα έχει ένα δίκτυο τόσο πιο απαιτητική γίνεται η μοντελοποίησή του από την άποψη των υπολογιστικών πόρων. Με τη σημαντική υποσημείωση όμως ότι υπήρχαν ήδη υπολογιστικά κέντρα υψηλής ισχύος και χρησιμοποιούνταν συστηματικά σε βαριές εργασίες, όπως η προσομοίωση φυσικών συστημάτων. Αν τα βαθιά νευρωνικά δίκτυα είχαν όντως να δείξουν κάτι (όπως φάνηκε στη συνέχεια), τότε δεν υπήρχε λόγος να μην μοντελοποιηθούν σε τέτοια κέντρα. Κατά τη γνώμη μας, μακράν ο σημαντικότερος παράγοντας υπήρξε η πλημμυρίδα δεδομένων σε ψηφιακή μορφή, ακριβώς επειδή κάθε στατιστικό μοντέλο, όπως τα νευρωνικά δίκτυα (και όχι μόνο), απαιτεί τεράστιο όγκο δεδομένων ώστε να «μάθει» το ο,τιδήποτε χρήσιμο. Αλλά ακόμα κι εδώ, η απλή αναφορά στη διάδοση του διαδικτύου έχει κάτι το παραπλανητικό. Μία επιπλέον προϋπόθεση για την εκπαίδευση τέτοιων μοντέλων είναι και η διαθεσιμότητα καλά οργανωμένων δεδομένων υψηλής ποιότητας, χωρίς θόρυβο και παραλείψεις - «σιωπές». Όσον αφορά δε στην πρακτική εφαρμοσιμότητα αυτών των τεχνικών, τα μοντέλα τους θα ήταν απλώς άχρηστα αν δεν μπορούσαν να επανεκπαιδεύονται συνεχώς ώστε να προσαρμόζονται σε νέες καταστάσεις· απαιτούν, με άλλα λόγια, και μια συνεχή ροή δεδομένων. Το διαδίκτυο, στη γενική του, δημόσια μορφή, απλώς δεν πληροί αυτές τις προϋποθέσεις και οι περισσότερες εφαρμογές τεχνητής νοημοσύνης δεν σκανάρουν τον παγκόσμιο ιστό για να βρουν δεδομένα. Αυτό που χρειαζόταν ήταν η καθολική δικτύωση μέσω τεχνικών και συσκευών καταγραφής που ξέρουν τι, πότε και πώς να το καταγράψουν. Ή αλλιώς, αυτό που έχει αρχίσει να ονομάζεται Big Data και διαδίκτυο των πραγμάτων.
Δεν είναι τυχαίο εξάλλου το γεγονός ότι οι περισσότερες εταιρείες που δραστηριοποιούνται στον χώρο (και μάλιστα πρωτοστατούν, έχοντας αφήσει πίσω τους τα κρατικά ερευνητικά ιδρύματα) παρέχουν ελεύθερη πρόσβαση σε σημαντικό τμήμα των αλγορίθμων τους, [12Για παράδειγμα, ο οποιοσδήποτε μπορεί να κατεβάσει και να παίξει με την πλατφόρμα μηχανικής μάθησης Tensorflow της Google.] αλλά αποφεύγουν συστηματικά να παρέχουν πρόσβαση στα δεδομένα που συλλέγουν και με τα οποία τροφοδοτούν αυτούς τους αλγορίθμους. Αποτελεί κοινό μυστικό ότι ακόμα και ο ιδιοφυέστερος ερευνητής, ακόμα κι αν έχει στα χέρια του αυτούς τους αλγορίθμους, όσο κι αν σπαζοκεφαλιάσει, δεν έχει καμία πιθανότητα να επιτύχει κάτι άξιο λόγου χωρίς τα κατάλληλα δεδομένα. Κι αντίστροφα, όποιος έχει τη δυνατότητα για συστηματική συλλογή δεδομένων, θεωρείται ότι μπορεί να αποκτήσει και αξιοσημείωτο προβάδισμα στην κούρσα εξοπλισμών της τεχνητής νοημοσύνης. [13Βλ. το άρθρο του MIT Sloan Management Review, The Machine Learning Race Is Really a Data Race.] Τυπικό παράδειγμα τέτοιας περίπτωσης, που προκαλεί πονοκέφαλο (και μάλλον ζηλοφθονία) στη Δύση, είναι φυσικά οι κινέζικες εταιρείες οι οποίες, με την διακριτική υποστήριξη του κινέζικου κράτους, έχουν αποδυθεί σε μία ανελέητη προσπάθεια συστηματικής συλλογής δεδομένων, με αποτέλεσμα να μπορούν να επιδείξουν εντυπωσιακά επιτεύγματα στον τομέα της τεχνητής νοημοσύνης. [14Βλ. το άρθρο του Economist, Why China’s AI push is worrying.]
Ο αριθμός των αναφορών στους όρους Big Data και Τεχνητή Νοημοσύνη στα μέσα ενημέρωσης και σε ακαδημαϊκά άρθρα. Η στατιστική συσχέτιση είναι μάλλον προφανής!
Από το άρθρο του Yarden Katz, Manufacturing an Artificial Intelligence Revolution.
Αν γίνουν δεκτές οι παραπάνω παρατηρήσεις, τότε ανοίγεται κι ένας άλλος δρόμος για την ερμηνεία του ρόλου της τεχνητής νοημοσύνης (κι εν τέλει και της «ουσίας» της) στη σημερινή φάση αλλαγής του καπιταλιστικού παραδείγματος, πέρα από το μεταφυσικό καρότο της υπόσχεσης για μια μέλλουσα ζωή απαλλαγμένη από βαρετές εργασίες, χωρίς πόνο και ασθένειες (κι όμως, έχουν ειπωθεί κι αυτά!) και το μαστίγιο για χαμένες θέσεις εργασίας και «πλεονάζον ανθρώπινο δυναμικό» λόγω της αυτοματοποίησης. Αρκεί να θυμηθούμε το παλιό όνειρο της κυβερνητικής για προσαρμοστικά κοινωνικο-τεχνικά (και όχι απλώς τεχνικά) υπερσυστήματα με μηχανισμούς αυτοδιόρθωσης. Μπορεί να μη λέγεται ευθέως και ο όρος «κυβερνητική» μπορεί να μην έχει πλέον την αίγλη που είχε κάποτε, έχοντας εκπέσει από το λεξιλόγιο των επιστημόνων. Όμως ο στόχος παραμένει ο ίδιος: η καθολική, μηχανική διαμεσολάβηση του κοινωνικού εργοστασίου μέσα από τη συνεχή συλλογή και αξιοποίηση δεδομένων, όπου η τεχνητή νοημοσύνη αναλαμβάνει τον κρίσιμο ρόλο της ρυθμιστικής, «διορθωτικής» βαλβίδας· είναι το μέσο για την υλοποίηση των μηχανισμών ανάδρασης του κοινωνικο-τεχνικού εργοστασίου. Με τη διαφορά ότι εδώ δεν πρόκειται για τη γραμμική μορφή του κοινωνικού εργοστασίου που ανέλυσαν οι Ιταλοί αυτόνομοι, αλλά για τη σύγχρονη και μάλλον πιο «αποδοτική» μορφή ενός παραγωγικού δικτύου.
Δύο διευκρινιστικές παρατηρήσεις κρίνονται απαραίτητες σε αυτό το σημείο. Πρώτον, δεν χρειάζεται να πάρει κανείς τοις μετρητοίς τις φαντασιώσεις της πρώιμης κυβερνητικής περί μιας πλήρους μηχανοποίησης του κοινωνικού πεδίου. Θα έπρεπε να είναι προφανές ότι τέτοια σενάρια έχουν θέση στην επιστημονική φαντασία (και καλώς βρίσκουν εκεί μια θέση, καλλιτεχνική αδεία), όχι όμως και σε μια κριτική ανάλυση. Αυτό που έχει σημασία είναι η τάση προς μια τεχνική ρύθμιση του φάσματος των παραγωγικών και κοινωνικών σχέσεων μέσα από μια συνεχή καταγραφή και πρόβλεψη των κατευθύνσεών του· με άλλα λόγια, η τάση προς μια επόπτευση και αξιοποίηση του κοινωνικού ακόμα και σε μικρο-μοριακό επίπεδο, δυνατότητα που ήταν αδιανόητη ακόμα και σε πρόσφατες φάσεις της καπιταλιστικής οργάνωσης. Δεύτερον, όσον αφορά στους σκοπούς που τίθενται σε ένα τέτοιο «υπερσύστημα», δεν είναι καθόλου απαραίτητο να καταφύγει κανείς σε συνωμοσιολογικού τύπου θεωρίες περί κάποιων δαιμονικών puppet master που πατάνε κουμπάκια μπροστά σε οθόνες. Η ίδια η εσωτερική δυναμική του καπιταλισμού αρκεί από μόνη της για να του προσδώσει τους κατάλληλους σκοπούς. Για να δώσουμε ένα απλό παράδειγμα, τα συστήματα μηχανικής μάθησης αυτοδιαφημίζονται ως το απόγειο της αντικειμενικότητας στη λογική του ότι απλώς ανακαλύπτουν ό,τι υπάρχει ήδη στα δεδομένα. Όμως έχει αποδειχθεί επανειλημμένα ότι όχι απλώς δεν είναι αντικειμενικά, αλλά και ότι ενσωματώνουν τις προκαταλήψεις των κατασκευαστών – εκπαιδευτών τους. Πώς άραγε μπορεί να ερμηνεύσει ένα νευρωνικό δίκτυο μια φωτογραφία από σημείο ελέγχου στην Παλαιστίνη; Ως «μια ομάδα ανθρώπων σε μια χιονοσκέπαστη πλαγιά»! Γιατί πολύ απλά δεν εκπαιδεύτηκε ποτέ σε τέτοιες εικόνες (εξάλλου αφορούν τέτοια απόμακρα γεγονότα τους μακάριους κατασκευαστές του;) και γιατί είναι παροιμιωδώς δύσκολο (για την ακρίβεια αδύνατο) για ένα τέτοιο δίκτυο να «κατανοήσει» και να λάβει υπόψιν τα ιστορικά και πολιτικά συμφραζόμενα μιας εικόνας κι εν γένει το συγκείμενο μιας «πληροφορίας». Ακόμα και μικρές τροποποιήσεις σε αυτό το συγκείμενο μπορούν εύκολα να προκαλέσουν «εγκεφαλικό» στους νευρώνες ενός τέτοιου δικτύου. Κάθε αλγόριθμος μηχανικής μάθησης είναι αναγκασμένος να ενσωματώνει στη λειτουργία του μια συγκεκριμένη προειλημμένη οπτική γωνία, τόσο για τεχνικούς λόγους, [15Υφίσταται και τεχνικός-μαθηματικός λόγος για την εξάρτηση των αλγορίθμων μηχανικής μάθησης από προκαταλήψεις (ο όρος είναι bias κι έχει συγκεκριμένη τεχνική σημασία), αλλά δεν θα επεκταθούμε εδώ. Σημειώνουμε απλώς ότι τέτοιες «λεπτομέρειες» έχουν την τάση να αποσιωπούνται όταν παρουσιάζονται τα θαύματα της μηχανικής μάθησης.] όσο και για (το κυριότερο) πολιτικούς. Η αντίληψη περί αμερόληπτης αντικειμενικότητας της τεχνητής νοημοσύνης ανήκει απλώς στο ρεπερτόριο της ιδεολογίας της.
Υπάρχει ένας εβραϊκός μύθος για έναν ραβίνο στην Πράγα του 16ου αιώνα που αποφάσισε να κατασκευάσει από πηλό και να δώσει ζωή σε ένα τεχνητό πλάσμα, γράφοντας στο μέτωπό του τη λέξη «αλήθεια» (emet). Μέχρι που αυτό, έχοντας περιορισμένες νοητικές ικανότητες, ξέφυγε από τον έλεγχό του και τελικά ο ραβίνος αναγκάστηκε να το θανατώσει σβήνοντας από το το μέτωπό του το πρώτο γράμμα για να αφήσει τη λέξη «θάνατος» (met). Πρόκειται φυσικά για το περίφημο Γκόλεμ (που έχει αποτυπωθεί και στο διάσημο, ομώνυμο ποίημα του Μπόρχες)· ένας μύθος που στη βασική του μορφή εμφανίζεται και σε άλλους πολιτισμούς και που μια παραλλαγή του επανέρχεται συστηματικά στα καλλιτεχνικά έργα της δύσης ήδη από την εποχή του Φρανκενστάιν και ακόμα πιο επίμονα τις τελευταίες δεκαετίες με αφορμή τις σκεπτόμενες μηχανές της τεχνητής νοημοσύνης. Δεν είναι αδικαιολόγητη αυτή η νεκρανάσταση του Γκόλεμ στο φαντασιακό των δυτικών κοινωνιών, τουλάχιστον ως συμβολική αναπαράσταση μιας βαθιάς αποξένωσης των ανθρώπων από τα ίδια τους τα έργα (από την εργασία τους). Το Γκόλεμ της τεχνητής νοημοσύνης του 21ου αιώνα μπορεί όντως να είναι πιο ηλίθιο κι από το αυθεντικό Γκόλεμ του 16ου αιώνα. Με μια μικρή επισήμανση, αν μας επιτρέπεται. Το σημερινό Γκόλεμ είναι προικισμένο με τις «χθόνιες δυνάμεις που καλεί η σύγχρονη αστική κοινωνία» για τις οποίες έγραφε σχεδόν 200 χρόνια πριν ο Μαρξ. Και δεν αντιμετωπίζεται με ξόρκια ούτε μόνο με λόγια σαν αυτό εδώ το άρθρο· εξάλλου ο αυθεντικός μύθος είναι ήδη δείγμα μιας «προκατάληψης» του δυτικού πολιτισμού υπέρ ενός είδους παντοδυναμίας του Λόγου (με κεφαλαίο Λ) απέναντι στον πηλό της ζωής. Καλό είναι να θυμόμαστε ότι μέσα από την ίδια «προκατάληψη» γεννήθηκε και η τεχνητή νοημοσύνη, ως αφηρημένη επεξεργασία συμβόλων που (υποτίθεται ότι) αδιαφορεί για το υλικό της υπόστρωμα.
Separatrix
Μερικές φωτογραφίες και οι ερμηνείες που δίνει σε αυτές ένα εκπαιδευμένο νευρωνικό της Google. Από το άρθρο του Yarden Katz, Manufacturing an Artificial Intelligence Revolution. Ο Katz είναι επιστήμονας ισραηλινής καταγωγής και ισχυρά επικριτικός των πρακτικών του ισραηλινού καθεστώτος, εξ ου και η επιλογή της πρώτης και της τελευταίας φωτογραφίας. Φαίνεται ότι ο Katz είναι ένας απ’ τους χιλιάδες εβραίους που μισούν τον εαυτό τους, κατά τις βαθυστόχαστες αναλύσεις όσων (ακόμα και «επαναστατών») ταυτίζουν τον αντισιωνισμό με τον αντισημιτισμό.
1 - Στην πραγματικότητα αθροίζονται τα τετράγωνα των αποστάσεων, εξ ου και ο όρος «ελαχίστων τετραγώνων».
[ επιστροφή ]
2 - Κάπου εκεί εξαντλούν την κριτική τους πολλά από τα έργα γνωστών φιλοσόφων που εναντιώνονται στη δυνατότητα μιας πραγματικής τεχνητής νοημοσύνης, με τυπικά παραδείγματα αυτά των Hubert Dreyfus και John Searle.
[ επιστροφή ]
3 - Τυπικό παράδειγμα είναι το (ομολογουμένως κάπως παλιό) βιβλίο του John Haugeland, Τεχνητή νοημοσύνη, εκδ. Κάτοπτρο.
[ επιστροφή ]
4 - Κλασσικό τέτοιο εγχειρίδιο είναι το βιβλίο των Russel και Norvig, Artificial intelligence: a modern approach.
[ επιστροφή ]
5 - Βλ. Sarajevo, Τετράδια για εργατική χρήση νο 3, Η μηχανοποίηση της σκέψης. Για μια κατατοπιστική, αλλά συμβατική ιστορία της τεχνητής νοημοσύνης βλ. επίσης το βιβλίο της Pamela McCorduck, Machines who think (Η χρήση της αντωνυμίας who στον τίτλο, που χρησιμοποιείται αποκλειστικά για πρόσωπα και όχι για πράγματα, προφανώς δεν είναι τυχαία). Για μια γενεαλογία της έννοιας της νοημοσύνης, βλ. Cyborg, τ. 8, το τεστ Turing: σημειώσεις για μια γενεαλογία της «νοημοσύνης».
[ επιστροφή ]
6 - Οι τίτλοι των βιβλίων του Norbert Wiener, ενός εκ των θεμελιωτών της κυβερνητικής, είναι εύγλωττοι: Cybernetics: Or Control and Communication in the Animal and the Machine (1948), The Human Use of Human Beings (1950).
[ επιστροφή ]
7 - Ένα απλοϊκό παράδειγμα θα ήταν και η μέθοδος ελαχίστων τετραγώνων (αν και δεν περιλαμβάνει ακριβώς μηχανισμό ανάδρασης με την αυστηρή έννοια). Αν έρθουν καινούρια δεδομένα σε ένα «σύστημα ελαχίστων τετραγώνων», τότε αυτό μπορεί να ξανατρέξει τους υπολογισμούς του ώστε να αναπροσαρμόσει την ευθεία (να «μάθει» τη νέα ευθεία) με βάση αυτά τα νέα δεδομένα.
[ επιστροφή ]
8 - Δεν υπάρχει νευροβιολόγος σήμερα που να πιστεύει σοβαρά ότι τα τεχνητά νευρωνικά δίκτυα έχουν την οποιαδήποτε εξηγητική αξία όσον αφορά στη μελέτη πραγματικών εγκεφάλων. Τα μοντέλα νευρωνικών δικτύων που χρησιμοποιούν στις δικές τους προσομοιώσεις είναι εξαιρετικά πιο περίπλοκα από τα τεχνητά νευρωνικά δίκτυα.
[ επιστροφή ]
9 - Προς αποφυγή παρεξηγήσεων, αναφέρουμε (ξανά) ότι τα νευρωνικά δίκτυα δεν είναι μη αλγοριθμικά μοντέλα. Απλώς λειτουργούν σε ένα πιο χαμηλό επίπεδο αφαίρεσης όπου τα σύμβολά τους δεν έχουν άμεση αντιστοίχηση σε αυτό που ένας άνθρωπος θα κατανοούσε πιο άμεσα ως σύμβολα, όπως συμβαίνει με τα συμβολικά συστήματα. Παραμένουν ωστόσο αλγοριθμικά μοντέλα χειρισμού συμβόλων.
[ επιστροφή ]
10 - Η διάκριση ανάμεσα σε συμβολικές και συνδετιστικές προσεγγίσεις δεν έχει σήμερα την ίδια βαρύτητα που είχε στο παρελθόν, από τη στιγμή που τείνουν να ενωθούν. Υπάρχουν πλέον νευρωνικά δίκτυα με την ικανότητα να αναπαριστούν στους κόμβους τους λογικά κατηγορήματα. Υπάρχουν επίσης και άλλες μέθοδοι, με αξιοσημείωτη επιτυχία σε κάποιους τομείς, που όμως δεν είναι εύκολα κατηγοριοποιήσιμες είτε ως συμβολικές είτε ως συνδετιστικές. Η αιχμή του δόρατος πάντως παραμένουν τα νευρωνικά δίκτυα.
[ επιστροφή ]
11 - Why artificial intelligence is enjoying a renaissance
[ επιστροφή ]
12 - Για παράδειγμα, ο οποιοσδήποτε μπορεί να κατεβάσει και να παίξει με την πλατφόρμα μηχανικής μάθησης Tensorflow της Google.
[ επιστροφή ]
13 - Βλ. το άρθρο του MIT Sloan Management Review, The Machine Learning Race Is Really a Data Race.
[ επιστροφή ]
14 - Βλ. το άρθρο του Economist, Why China’s AI push is worrying.
[ επιστροφή ]
15 - Υφίσταται και τεχνικός-μαθηματικός λόγος για την εξάρτηση των αλγορίθμων μηχανικής μάθησης από προκαταλήψεις (ο όρος είναι bias κι έχει συγκεκριμένη τεχνική σημασία), αλλά δεν θα επεκταθούμε εδώ. Σημειώνουμε απλώς ότι τέτοιες «λεπτομέρειες» έχουν την τάση να αποσιωπούνται όταν παρουσιάζονται τα θαύματα της μηχανικής μάθησης.
[ επιστροφή ]