Cyborg
Cyborg #29 - 02/2024

#29 - 02/2024

Όταν τα ρομπότ τεχνητής νοημοσύνης κάνουν γενετική μηχανική: η έκρηξη των τεχνητών πρωτεϊνών και η βιοπειρατεία της τεχνητής νοημοσύνης

«Τα όρια παραβιάζονται τώρα. Πλησιάζουμε σε ένα σημείο καμπής με την άφιξη αυτών των τεχνολογιών ανώτερης τάξης, των πιο βαθιών στην ιστορία. Το επερχόμενο τεχνολογικό κύμα βασίζεται κυρίως σε δύο τεχνολογίες γενικής χρήσης, ικανές να λειτουργούν τόσο στο πιο μεγάλο όσο και στο πιο λεπτομερές επίπεδο: την τεχνητή νοημοσύνη και τη συνθετική βιολογία».

Mustafa Suleyman, συνιδρυτής της DeepMind (τώρα ανήκει στην Google) και της Inflection AI

“Text-to-organism” είναι η συντομογραφία μου για ένα φανταστικό σύστημα όπου πληκτρολογείτε (σε κείμενο) τα χαρακτηριστικά που θέλετε για έναν γενετικά τροποποιημένο οργανισμό και στη συνέχεια ένας αλγόριθμος τεχνητής νοημοσύνης σχεδιάζει το DNA για εσάς, ίσως ακόμη και εκτυπώνοντας το τροποποιημένο DNA έτοιμο να ενσωματωθεί σε έναν ζωντανό οργανισμό.

Σε αντίθεση με το Midjourney ή το ChatGPT, η δυνατότητα μετατροπής κειμένου σε οργανισμό δεν υπάρχει ακόμα - αλλά δεν είναι τόσο μακριά όσο θα μπορούσατε να υποθέσετε. Μαζί με άλλες εξελίξεις κατά μήκος των ταχέως συγχωνευόμενων συνόρων της τεχνητής ζωής και της τεχνητής νοημοσύνης, οι εξελίξεις που πριν από τρία χρόνια θα κατατάσσονταν στην ενότητα «Επιστημονική Φαντασία/Φαντασία» χαρακτηρίζονται τώρα ως «Επιχειρήσεις/Κεφάλαιο Επιχειρήσεων». […]

Μιλώντας για χάραξη πολιτικής, είμαι μέλος της Πολυθεματικής Ειδικής Τεχνικής Ομάδας Εμπειρογνωμόνων (mAHTEG - Multidisciplinary Ad Hoc Technical Expert Group) του ΟΗΕ για τη Συνθετική Βιολογία - στο πλαίσιο της Σύμβασης για τη Βιοποικιλότητα. Είμαστε μια μικρή ομάδα που έχει επιφορτιστεί από τις κυβερνήσεις με τη «σάρωση του ορίζοντα, την αξιολόγηση και την παρακολούθηση» των νέων εξελίξεων στη γενετική μηχανική αιχμής (ή «συνθετική βιολογία»). Χάρηκα όταν η mAHTEG ανέλαβε αυτό το θέμα της ενσωμάτωσης της τεχνητής νοημοσύνης και της συνθετικής βιολογίας. Ωστόσο, όταν άρχισα να εξετάζω πιο προσεκτικά, έμεινα έκπληκτος από το πόσο πολύ είχε προχωρήσει ο τομέας. Ειδικότερα, φαίνεται ότι οι εξελίξεις στη λεγόμενη «generative AI» - η παραγωγή νέων κειμένων, εικόνων, βίντεο κ.λπ. όπως το παράδειγμα του ChatGPT της Open AI - φέρνει τώρα μια παράλληλη μετατόπιση στον τρόπο με τον οποίο η ζωή μπορεί να επανασχεδιαστεί, να χειραγωγηθεί και να κατασκευαστεί.  Έχει επίσης επιφέρει έναν καταιγισμό από πρόσθετα κεφάλαια, εταιρικού ενθουσιασμού και διαφημιστικής εκστρατείας στον ήδη πυρακτωμένο εμπορικό χώρο που είναι γνωστός ως «Syn Bio». Οι μεγαλύτεροι εταιρικοί παίκτες στην επανάσταση της Τεχνητής Νοημοσύνης, πολλοί από τους οποίους δεν έχουν θεσμικό υπόβαθρο στη βιολογία, αρχίζουν τώρα με ανυπομονησία να παίζουν με τα πιο μικρά μέρη των έμβιων όντων. Όπως έγραψα πρόσφατα στους συναδέλφους μου μέλη του mAHTEG «η τρέχουσα ταχύτητα, οι επενδύσεις και οι μετατοπίσεις στις τεχνικές και εταιρικές εξελίξεις σε αυτό το πεδίο θα πρέπει να μας κάνει όλους να καθόμαστε στις θέσεις μας με μεγάλη προσοχή και εστίαση για να ασχοληθούμε με αυτό το θέμα».

Η «συνθετική βιολογία» (Syn Bio) είναι περισσότερο γνωστή στους κύκλους της τεχνολογίας, των επενδύσεων και της επιστημονικής πολιτικής [1περισσότερα: Συνθετική βιολογία και μοριακός προγραμματισμός: τα κύτταρα ως αλυσίδα της (ανα-)παραγωγής, Cyborg νο 5, Φλεβάρης 2016 - Συνθετική βιολογία, η γενεαλογία: η ζωή είναι φτηνη!, Cyborg νο 20, Φλεβάρης 2021.]. Παρουσιάζεται ως η κατασκευή ή ο «προγραμματισμός» τεχνητών μορφών ζωής (ένα είδος «ΓΤΟ 2.0» ή «ακραίας γενετικής μηχανικής»). Ως τομέας η Syn Bio θεμελιώθηκε πριν από δύο δεκαετίες πάνω στη χρήση μεγάλων συνόλων γονιδιωματικών δεδομένων (big data) και νέων εργαλείων με τα οποία οι γενετικοί μηχανικοί θα μπορούσαν ορθολογικά να επανασχεδιάσουν βιολογικά μέρη, οργανισμούς και συστήματα. Η χρήση της τεχνητής νοημοσύνης για τον επανασχεδιασμό της γενετικής υπήρχε πάντα σε κάποια μορφή. Εταιρείες συνθετικής βιολογίας όπως οι Amyris Biotechnologies, Zymergen και Gingko Bioworks (μόνο η τελευταία υπάρχει ακόμη) χρησιμοποιούν μορφές τεχνητής νοημοσύνης, εδώ και πάνω από μια δεκαετία - αξιοποιώντας αλγορίθμους για την ταξινόμηση γονιδιωματικών δεδομένων και την επιλογή βιώσιμων αλληλουχιών DNA στο πλαίσιο των διαδικασιών σχεδιασμού γονιδιώματος. Ωστόσο, τον περασμένο χρόνο, η κυκλοφορία μαζικών «θεμελιωδών μοντέλων» τεχνητής νοημοσύνης (όπως το ChatGPT της Open AI, το Bard της Google, το LLAMA της Meta ή το Stable Diffusion της Stability AI) δεν επέφερε μόνο μια ιστορική αλλαγή στο χώρο της τεχνητής νοημοσύνης. Τώρα οδηγεί επίσης μια παράλληλη αλλαγή στο χώρο της Syn Bio. Αυτή η αλλαγή περιγράφεται ως μια κίνηση από τη «discriminative AI» στην «generative AI» και στη βιοτεχνολογία συνοδεύει μια αλλαγή από τη γονιδιωματική ανάλυση σε μια πιο γενετική συνθετική βιολογία.

Για να το θέσουμε χονδρικά, ενώ η discriminative AI της προηγούμενης δεκαετίας αφορούσε την ταξινόμηση των διαφορών μεταξύ των δεδομένων για τον εντοπισμό συστάδων και ακραίων τιμών (αυτοματοποιημένη ανάλυση υψηλής απόδοσης), η generative AI παράγει άμεσα νέες μορφές ή αναδιατάξεις αυτών των δεδομένων (αυτοματοποιημένος de-novo σχεδιασμός υψηλής απόδοσης). Τα σημερινά μεγάλα γλωσσικά μοντέλα (LLM), όπως το ChatGPT, ανταποκρίνονται σε ένα ανθρώπινο αίτημα ή «προτροπή» προβλέποντας ποια στοιχεία δεδομένων θα ικανοποιήσουν κατά πάσα πιθανότητα το αίτημα του χρήστη. Στη συνέχεια, η ΤΝ συνθέτει αυτόματα κείμενα, εικόνες ή βίντεο που μας φαίνονται ως εντελώς νέα και δημιουργικά, αλλά στην πραγματικότητα είναι απλώς μια σειρά από προβλέψεις. Τα προγράμματα της generative AI εξάγουν αυτές τις νέες μορφές στον κόσμο ως συνθετικές εικόνες, συνθετικό κείμενο, συνθετικό βίντεο κ.λπ.
Ο μηχανισμός με τον οποίο λειτουργεί η δημιουργική τεχνητή νοημοσύνη μπορεί να μοιάζει λίγο με μαγεία, αλλά στην πραγματικότητα είναι απλώς στατιστική. Πρώτα αυτά τα συστήματα περνούν από μαζική υπολογιστική «μηχανική μάθηση» ή «εκπαίδευση». Αυτή ταξινομεί και χαρτογραφεί μοτίβα σχέσεων μεταξύ στοιχείων μέσα σε δισεκατομμύρια ψηφιακά εισερχόμενα κείμενα και εικόνες για να δημιουργήσει αλγοριθμικούς κανόνες. Πχ αυτή η μηχανική εκπαίδευση μπορεί να καταγράψει πόσο πιο συχνά η λέξη «πίτσα» συνδέεται με τη λέξη «τυρί» παρά με τη λέξη «ελέφαντας» - και να φτιάξει έναν κανόνα από αυτό. Οι ειδικοί της ΤΝ στη συνέχεια «τελειοποιούν» αυτά τα γενικά μοντέλα σχέσεων σε πιο εξειδικευμένα σύνολα δεδομένων (για να βελτιώσουν τους κανόνες). Το σύστημα παράγει στη συνέχεια αποτελέσματα που συνάδουν με τους αλγοριθμικούς κανόνες που έχει συμπεράνει το εκπαιδευμένο μοντέλο, επιλέγοντας το πιο πιθανό πράγμα στατιστικά (πχ την πιο πιθανή επόμενη λέξη σε μια παράγραφο).  Αυτό δημιουργεί φαινομενικά νέες παραλλαγές κειμένου ή εικόνας που ικανοποιούν το αίτημα των χρηστών για νέα αλλά συνεκτικά «συνθετικά μέσα». […]

Cyborg #29

Συνθετική βιολογία ενισχυμένη από την ΑΙ

Έχοντας φαινομενικά κατακτήσει την παραγωγή συνθετικών κειμένων, εικόνων, ήχων και βίντεο, οι κορυφαίες εταιρείες τεχνητής νοημοσύνης (στις οποίες περιλαμβάνονται οι μεγαλύτερες και πλουσιότερες εταιρείες του κόσμου με βάση την κεφαλαιοποίηση της αγοράς) εστιάζουν τώρα στην αξιοποίηση άλλων εμπορικά πολύτιμων μορφών «γλώσσας» στις οποίες θα μπορούσαν να εκπαιδεύσουν τα «μεγάλα γλωσσικά μοντέλα» τους. Ειδικότερα, υπάρχει απίστευτος ενθουσιασμός για την τεχνητή νοημοσύνη όσον αφορά την κατάκτηση των βιολογικών «γλωσσών» της γονιδιωματικής και της πρωτεϊνομικής (και κατ' επέκταση του πεδίου της συνθετικής βιολογίας).  Έχοντας «αναστατώσει» θεαματικά τη γραφιστική σχεδίαση, τη συγγραφή σεναρίων, τη διαφήμιση, τον κινηματογράφο, το νομικό επάγγελμα, τη δημοσιογραφία και πολλά άλλα, τώρα οι βιομηχανίες της ζωής (γεωργία, τρόφιμα, συντήρηση, υγειονομική περίθαλψη) καθώς και η βιολογική παραγωγή υλικών βρίσκονται σταθερά στο στόχαστρο των εταιρειών τεχνητής νοημοσύνης που αναζητούν την επόμενη «εφαρμογή που θα τα σπάει» ή την επόμενη γερή πληρωμή τους. Αυτό θεωρείται ως το επόμενο εμπορικό σύνορο πολλών τρισεκατομμυρίων δολαρίων για την επανάσταση της generative AI που θα «συνταράξει την αγορά» και θα αποφέρει μεγάλες απολαβές στους επενδυτές.

Ο διευθυντής έρευνας τεχνητής νοημοσύνης της NVIDIA (ο κορυφαίος παραγωγός τσιπ ΑΙ) Anima Anandkumar, περιγράφει ένα παράδειγμα του πώς μια κορυφαία εταιρεία τεχνητής νοημοσύνης κάνει αυτή τη μετάβαση στην εφαρμογή των δυνατοτήτων της generative AI στη συνθετική βιολογία. Περιγράφει το νέο μεγάλο γλωσσικό μοντέλο GenSLM της Nvidia με τον εξής τρόπο:

«Αντί να δημιουργούμε την αγγλική γλώσσα ή οποιαδήποτε άλλη φυσική γλώσσα, γιατί να μην σκεφτούμε τη γλώσσα των γονιδιωμάτων; Ξέρετε, πήραμε όλα τα δεδομένα DNA που είναι διαθέσιμα - τόσο δεδομένα DNA όσο και δεδομένα RNA, για τους ιούς και τα βακτήρια που μας είναι γνωστά - περίπου εκατόν δέκα εκατομμύρια τέτοια γονιδιώματα. Εκπαιδεύσαμε ένα γλωσσικό μοντέλο πάνω σε αυτά και στη συνέχεια μπορούμε τώρα να του ζητήσουμε να δημιουργήσει νέα γονιδιώματα».

Αν η αλαζονική περιγραφή της Nvdia σχετικά με την απλή «λήψη» όλων αυτών των δεδομένων DNA ακούγεται σαν μια μεγάλη αποικιακή αρπαγή (βιοπειρατεία) - αυτό συμβαίνει επειδή είναι. Θα επανέλθω σε αυτό.
Ως επίδειξη του GenSLM, η Nvidia «τελειοποίησε» πρόσφατα το γονιδιωματικό γλωσσικό μοντέλο της (με βάση αυτά τα 110 εκατομμύρια «ληφθέντα» γονιδιώματα) με ένα επιπλέον σύνολο δεδομένων 1,5 εκατομμυρίου ιικών αλληλουχιών covid, προκειμένου να δημιουργήσει αλληλουχίες DNA για νέες παραλλαγές του κορονοϊού. Το έκαναν αυτό, όπως είπαν, προκειμένου να βοηθήσουν στην πρόβλεψη πανδημίας και στο σχεδιασμό εμβολίων - αν και αυτό που δεν αναγνώρισαν ανοικτα είναι ότι αυτό έχει επίσης διπλές ανησυχίες ασφαλείας. Αν εσείς ή εγώ αποφασίζαμε να δημιουργήσουμε σχέδια για μολυσματικά στελέχη βιολογικών ιών στον υπολογιστή σας, θα περιμένατε ότι οι υπηρεσίες ασφαλείας θα σας χτυπούσαν πολύ γρήγορα την πόρτα. Θα επανέλθω και σε αυτό.

Η Nvidia ανακοίνωσε με υπερηφάνεια ότι μεταξύ των συνθετικών παραλλαγών του covid που παρήγαγε ψηφιακά το GenSLM υπήρχαν και στελέχη που ταιριάζουν πολύ με τις πραγματικές πρόσφατες νέες βιολογικές παραλλαγές που εμφανίστηκαν στη φύση. Δηλαδή: προέβλεψαν σωστά τον τρόπο με τον οποίο θα μπορούσε να μεταλλαχθεί ο Sars-C-V-2. Αυτό έχει σημασία επειδή βοηθά στις προσπάθειες επιτήρησης και στο σχεδιασμό εμβολίων. Αλλά αυτή η εργασία δεν αφορά μόνο την covid.  Η Nvidia υπογραμμίζει ότι το γονιδιωματικό μοντέλο μεγάλης γλώσσας (GenSLM) θα μπορούσε τώρα να ρυθμιστεί λεπτομερώς για να δημιουργήσει εκ νέου γονιδιώματα άλλων ιών ή βακτηρίων, επιτρέποντας την αυτόματη δημιουργία νέων syn-bio-μικροβίων, όπως το ChatGPT παράγει κείμενα. Μόλις αποκτήσει αυτές τις νέες αλληλουχίες, το DNA μπορεί είτε να «εκτυπωθεί» σε έναν συνθέτη DNA είτε να τροποποιηθεί σε έναν ζωντανό οργανισμό με τη χρήση εργαλείων γονιδιακής επεξεργασίας τύπου CRISPR. Στις μέρες μας είναι ένα σχετικά ασήμαντο βήμα για να περάσει κανείς από το σχεδιασμό ενός νέου σχεδίου γονιδιώματος σε έναν υπολογιστή, στην εφαρμογή του σε βιολογικό λογισμικό - το δύσκολο είναι να γίνει ο σχεδιασμός σωστά.  Στην πραγματικότητα, η Nvidia δημιούργησε ένα πρώτο «ChatGPT για το σχεδιασμό ιών και μικροβίων».

Θα πρέπει να σημειωθεί ότι η NVIDIA - μια παραδοσιακή εταιρεία κατασκευής τσιπ και η έκτη μεγαλύτερη εταιρεία στον κόσμο με βάση την κεφαλαιοποίησή της  - δεν θεωρούνταν προηγουμένως εταιρεία βιοεπιστημών. Ως εκ τούτου, ενδέχεται να μην έχει τα κατάλληλα εσωτερικά ένστικτα για την αντιμετώπιση του μικροβιολογικού κινδύνου ή της πολύπλοκης πολιτικής της μηχανικής βιολογίας. Ακόμα και οι εταιρείες βιοτεχνολογίας δεν είναι πολύ καλές σε αυτό - δείτε την πορεία της Bayer (πρώην Monsanto) με παγκόσμιες διαμαρτυρίες, αγωγές, γενετική ρύπανση κ.λπ.

Η Nvidia απέχει πολύ από το να είναι ο μόνος τεχνολογικός γίγαντας τρισεκατομμυρίων δολαρίων που εφαρμόζει γενετική τεχνητή νοημοσύνη σε οργανισμούς και εξαρτήματα Syn Bio. Η Meta (Facebook), η Microsoft (η οποία ελέγχει τώρα την Open AI), η Alphabet (Google) και η Stability AI επενδύουν σημαντικά στην ανάπτυξη εργαλείων generative AI για τη συνθετική βιολογία. Οι 3 πρώτες από αυτές, όπως και η NVIDIA, είναι επίσης μεταξύ των 7 πλουσιότερων εταιρειών στον κόσμο. Οι καθιερωμένοι εταιρικοί γίγαντες του κόσμου της βιοτεχνολογίας (πχ Bayer, Syngenta, Corteva) χρησιμοποιούν επίσης την generative AI ή συνάπτουν συμβάσεις με μικρότερες επιχειρήσεις που την εφαρμόζουν για λογαριασμό τους. Μια πρόσφατη έκθεση για την ΑΙ από ένα βρετανικό think tank, το Ινστιτούτο Ada Lovelace, υποστηρίζει ότι η αγορά για τεχνολογίες γονιδιωματικής με βάση την ΑΙ θα μπορούσε να φτάσει πάνω από 19,5 δισεκατομμύρια λίρες (περίπου 25 δισεκατομμύρια δολάρια ΗΠΑ) μέχρι το 2030, από μόλις μισό δισεκατομμύριο το 2021.  Αλλά αυτή η πρόβλεψη μπορεί να είναι ήδη ξεπερασμένη, δεδομένου του ρυθμού των εξελίξεων.

Ο αντίκτυπος της απλώς ψηφιακής generative AI είναι ήδη αισθητός σε πολλούς άλλους οικονομικούς τομείς (πχ ψυχαγωγία, δίκαιο, εκπαίδευση, διαφήμιση). Ωστόσο, οι ηγέτες της βιοτεχνολογίας και της τεχνητής νοημοσύνης διατυμπανίζουν ότι η εφαρμογή της generative AI στη βιολογία θα είναι μια πολύ πιο εκρηκτική πράξη «αναστάτωσης» από ό,τι έχουμε δει μέχρι σήμερα - προβλέποντας ακόμη και μια στιγμή «διάσπασης του ατόμου» για την τεχνητή νοημοσύνη. Στο πρόσφατο βιβλίο του «The Coming Wave» ο συνιδρυτής της Deep Mind (που τώρα ανήκει στην Google) Mustafa Suleyman μιλάει για την τρέχουσα συνάντηση της generative AI με τη Syn Bio ως το πιο σημαντικό «υπερκύμα» που έχουν δει ποτέ οι τεχνολόγοι. Ένας άλλος προσήλυτος της ζεύξης AI και Syn Bio είναι ο Jason Kelly, ceo της Gingko Bioworks. Η εταιρεία του σύναψε πρόσφατα πενταετή συνεργασία με την Google για την εκπαίδευση μεγάλων γλωσσικών μοντέλων για τη συνθετική βιολογία. Ο ίδιος περιγράφει την εξαιρετική εμπορική ευκαιρία της εφαρμογής της generative AI στη Syn Bio ως εξής:

«Να γιατί το 'Bio' είναι ιδιαίτερα ενδιαφέρον για τους ανθρώπους που ενδιαφέρονται για την τεχνητή νοημοσύνη: η ιδέα ενός βασικού μοντέλου και της τελειοποίησης με εξειδικευμένα δεδομένα - οι άνθρωποι της τεχνητής νοημοσύνης το καταλαβαίνουν αυτό. Ας το δοκιμάσουμε αυτό με μια από τις κατηγορίες της αγγλικής γλώσσας - ας πούμε τα νομικά.  Αυτό το πράγμα πρέπει να ανταγωνιστεί έναν δικηγόρο στο Robeson Grey που εκπαιδεύτηκε για 15 χρόνια, διδάχθηκε από άλλους ανθρώπους, γράφοντας συμβόλαια σχεδιασμένα να γίνονται κατανοητά από τους ανθρώπινους εγκεφάλους στα αγγλικά (μια γλώσσα που συν-εξελίχθηκε με τους εγκεφάλους μας). Αυτό μας δίνει επίσης το πλεονέκτημα του τρόπου με τον οποίο λειτουργεί ο εγκέφαλός μας - και έτσι ζητάμε από αυτούς τους εγκέφαλους των υπολογιστών - νευρωνικά δίκτυα - να μας ανταγωνιστούν στα δικά μας χωράφια.
Τώρα ας περάσουμε στη βιολογία. Σας θυμίζω πως ό,τι τρέχει σε κώδικα (διαδοχικά γράμματα) μοιάζει πολύ με τη γλώσσα - αλλά δεν είναι η γλώσσα μας, δεν την εφεύραμε, δεν την μιλάμε. Δεν την διαβάζουμε, ούτε την γράφουμε και έτσι αισθάνομαι ότι αυτοί οι εγκέφαλοι των υπολογιστών θα μας κόψουν τον κώλο πολύ πιο γρήγορα σε αυτόν τον τομέα απ' ότι στα αγγλικά... Εκεί πρέπει να κοιτάτε αν ψάχνετε να καταλάβετε πού η ΑΙ θα ανατρέψει πραγματικά το σενάριο… Δεν θα είναι μια απλή διαταραχή, αλλά μάλλον θα είναι κάτι σαν τη διάσπαση του ατόμου: στη βιολογία».

Cyborg #29

Black box βιολογία

Εν ολίγοις: ο Kelly επισημαίνει ότι τα ρομπότ τεχνητής νοημοσύνης θα είναι πιο άνετα με την πλοήγηση στη λογική της μηχανικής βιολογίας από ότι οι ανθρώπινοι εγκέφαλοι και έτσι όλο και περισσότερο εμείς οι ανθρώπινοι εγκέφαλοι θα δυσκολευόμαστε να καταλάβουμε τι κάνουν τα ρομπότ τεχνητής νοημοσύνης για τη γενετική μηχανική. Καθησυχαστικό; Ένα από τα θεμελιώδη ζητήματα στην ηθική της τεχνητής νοημοσύνης είναι ήδη κάτι που ονομάζεται «το πρόβλημα του μαύρου κουτιού». Πρακτικά αυτό περιγράφει πώς τα συστήματα ΑΙ αναπτύσσουν πολύπλοκα σύνολα κανόνων για τον εαυτό τους που δεν είναι προφανή ούτε μπορούν να γίνουν εύκολα κατανοητά από τους ανθρώπους. Ωστόσο, αυτοί οι αυτοαναπτυσσόμενοι κανόνες αναγκάζουν στη συνέχεια τα συστήματα ΑΙ να λαμβάνουν αποφάσεις που έχουν επιπτώσεις στον πραγματικό κόσμο. Το πρόβλημα του «μαύρου κουτιού» γίνεται ακανθώδες όταν, για παράδειγμα, ένα αυτοκινούμενο αυτοκίνητο που έχει εκπαιδευτεί από τεχνητή νοημοσύνη αποτυγχάνει να αναγνωρίσει ένα ποδήλατο και πέφτει πάνω του ή όταν αποφασίζει να επιταχύνει στο πλάι ενός φορτηγού. Επειδή η διαδικασία λήψης αποφάσεων μιας ΑΙ είναι ένα «μαύρο κουτί» για εμάς τους ανθρώπους, δεν μπορούμε να καταλάβουμε γιατί έλαβε αυτή τη δυνητικά μοιραία απόφαση και έτσι είναι σχεδόν αδύνατο να προφυλαχθούμε από αυτήν.

Σχετικό με αυτό είναι το φαινόμενο των «παραισθήσεων» που παράγουν τα generative AI συστήματα. Μεγάλα γλωσσικά μοντέλα, όπως το ChatGPT, ενσωματώνουν συστηματικά στην έξοδό τους στοιχεία που φαίνονται συναρπαστικά αλλά είναι ανακριβή ή παράξενα: ζωντανοί άνθρωποι περιγράφονται ως νεκροί, οι ημερομηνίες δίνονται λανθασμένα, ΑΙ εικόνες ανθρώπων που αναπτύσσουν πρόσθετα μέρη του σώματος ή δημιουργούνται παραμορφωμένες δυσανάγνωστες πινακίδες κ.λπ. Ενώ τέτοιες παραισθήσεις και αποτυχίες του μαύρου κουτιού μπορούν να είναι αρκετά προβληματικές στους δισδιάστατους και ηλεκτρονικούς τομείς του κειμένου, της εικόνας, του βίντεο ή του ήχου, θα μπορούσαν να είναι εξαιρετικά προβληματικές αν ενσωματώνονταν στον γονιδιωματικό σχεδιασμό τετραδιάστατων ζωντανών οργανισμών ή ενεργών βιολογικών πρωτεϊνών που απελευθερώνονται στο σώμα ή στη βιόσφαιρα.

Οι γενετικοί μηχανικοί αντιμετωπίζουν ήδη συνήθως προβλήματα απροσδόκητων και αναδυόμενων αποτελεσμάτων από μικρές γονιδιωματικές αλλαγές (ακόμη και τόσο μικρές όσο ένα μόνο ζεύγος βάσεων). Αν ένα γονιδίωμα σχεδιασμένο από ΑΙ αρχίσει να συμπεριφέρεται απρόβλεπτα ή να έχει σημαντικές παρενέργειες, μπορεί να είναι αδύνατο να κατανοήσουμε γιατί συνέβησαν αυτές οι αλλαγές ή να εντοπίσουμε την αιτία μέχρι πολύ καιρό μετά την είσοδο του οργανισμού ή της πρωτεΐνης στη βιόσφαιρα. Δεν είναι σαφές πώς μπορεί να προχωρήσει η αξιολόγηση της βιοασφάλειας οργανισμών ή πρωτεϊνών σχεδιασμένων από τεχνητή νοημοσύνη, όταν το σύστημα δεν είναι καν σε θέση να εξηγήσει τη λογική του σχεδιασμού του με τρόπους που μπορούμε να κατανοήσουμε. Ως απάντηση στα κακά προβλήματα του μαύρου κουτιού της ΑΙ, η ευρωπαϊκή ένωση δίνει τώρα προτεραιότητα στην ανάπτυξη της «εξηγήσιμης ΑΙ» [explainable AI].  Οι κυβερνήσεις μπορεί επίσης να επιμείνουν ότι κάθε οργανισμός, πρωτεΐνη ή άλλα βιολογικά συστατικά που σχεδιάζονται μέσω της generative AI πρέπει να είναι σε θέση να παρέχουν ισχυρές και κατανοητές από τον άνθρωπο εξηγήσεις για τις αποφάσεις του σχεδιασμού τους.

Cyborg #29

Δημιουργία νέων νανομηχανών - Κάνοντας την ΑΙ να «μιλάει» πρωτεΐνες

Για να επιστρέψω στην Gingko Bioworks, η συνεργασία της με την Google σε θέματα τεχνητής νοημοσύνης επικεντρώνεται αρχικά στη χρήση γεννητικής τεχνητής νοημοσύνης για το σχεδιασμό πρωτεϊνών - αξιοποιώντας την εσωτερική βάση δεδομένων της με 2 δισεκατομμύρια αλληλουχίες πρωτεϊνών.  Ο Jason Kelly της Gingko εξηγεί ότι «Η νέα ιδέα είναι: μπορώ να φτιάξω ένα μοντέλο θεμελίωσης που... να μιλάει πρωτεΐνες όπως το GPT4 μιλάει αγγλικά;».

Αξίζει να εστιάσουμε λίγο στο γιατί οι πρωτεΐνες έχουν σημασία ως εμπορικός στόχος. Ενώ η λέξη αυτή θυμίζει συνήθως ένα είδος συστατικού τροφίμων (κρέας, γαλακτοκομικά, όσπρια κ.λπ.), η πρωτεΐνη είναι στην πραγματικότητα ένα πολύ συγκεκριμένο είδος βιολογικής μορφής: μια αλυσίδα αμινοξέων, διπλωμένη σε μια τρισδιάστατη δομή, η οποία με τη σειρά της έχει συχνά βιοδραστικές ιδιότητες. Η βιολογία του λυκείου μας θυμίζει το λεγόμενο «κεντρικό δόγμα» της γενετικής όπου το DNA στο κύτταρο μεταφράζεται σε συγκεκριμένες θέσεις RNA που κωδικοποιούν τη σειρά με την οποία τα αμινοξέα συνδέονται σε μακρές αλυσίδες (πολυπεπτίδια). Αυτές οι αλυσίδες στη συνέχεια αναδιπλώνονται σε περίπλοκες πρωτεΐνες: δομές νανομεγέθους που εκτελούν τις διαδικασίες της ζωής. Σε αυτές περιλαμβάνονται ένζυμα και καταλύτες που επιτρέπουν, επιταχύνουν ή επιβραδύνουν βασικές βιοχημικές αντιδράσεις, καθώς και εκείνες οι πρωτεΐνες που δομούνται σε ζωντανά και μη υλικά. Οι πρωτεΐνες έχουν περιγραφεί ως οι νανομηχανές της φύσης - οι οποίες εκτελούν μεγάλο μέρος των εργασιών του έμβιου κόσμου σε μοριακή κλίμακα. Ο τρόπος με τον οποίο τα αμινοξέα κωδικοποιούνται από το DNA και το RNA και στη συνέχεια αναδιπλώνονται σε διαφορετικές δομές καθορίζει τον τρόπο με τον οποίο «προγραμματίζονται» αυτές οι μηχανές. Έτσι, το να μπορείς να «μιλάς πρωτεΐνες» σημαίνει ότι έχεις τη γλώσσα για να προγραμματίζεις βιολογικές νανομηχανές.

Για χρόνια η ουσία της έρευνας για τις πρωτεΐνες ήταν η προσπάθεια να κατανοήσουμε πώς οι αλληλουχίες αμινοξέων αναδιπλώνονται και ξεδιπλώνονται σε σχήματα με μοναδικό και σημαντικό βιολογικό και δομικό ρόλο. Ένας προς έναν οι επιστήμονες που ασχολούνται με τις πρωτεΐνες προσπάθησαν να προβλέψουν πώς μια δεδομένη γραμμική αλληλουχία αμινοξέων θα διπλωνόταν σε ένα συγκεκριμένο τρισδιάστατο σχήμα με συγκεκριμένες φυσικές και βιολογικές ιδιότητες. Ήταν μια αργή εργασία.  Στη συνέχεια, το 2018 η εταιρεία τεχνητής νοημοσύνης Deep Mind (που ανήκει στην Google) έλυσε φαινομενικά το παζλ της πρωτεϊνικής αναδίπλωσης. Το πρόγραμμα Alphafold της Deep Mind ήταν ένα μοντέλο τεχνητής νοημοσύνης που εκπαιδεύτηκε σε πάνω από 170.000 πρωτεΐνες από ένα δημόσιο αποθετήριο πρωτεϊνικών ακολουθιών και δομών και φάνηκε να προβλέπει με επιτυχία το σχήμα μιας διπλωμένης πρωτεΐνης από τον αρχικό γραμμικό της κώδικα σχεδόν κάθε φορά. Το 2022 η Deep Mind κυκλοφόρησε μια βάση κωδικών με προβλέψεις αναδίπλωσης πρωτεϊνών που περιείχε σχεδόν κάθε πρωτεΐνη γνωστή στην επιστήμη - σχεδόν 200 εκατομμύρια διαφορετικές δομές. Το επίτευγμα του Alphafold θεωρείται συχνά ως ένα από τα ισχυρότερα παραδείγματα «επιτυχίας» της τεχνητής νοημοσύνης στην επιστήμη.

Αλλά δεν αρκεί να δουλεύουμε μόνο με γνωστές πρωτεΐνες. Μετά την επιτυχία του Alphafold, αρκετά από τα πρώτα μοντέλα generative AI στη συνθετική βιολογία εστιάζουν στη δημιουργία εντελώς νέων πρωτεϊνών που δεν έχουν εμφανιστεί ποτέ στη φύση («γεννητικός σχεδιασμός πρωτεϊνών»), καθώς και στην τροποποίηση και «βελτιστοποίηση» των υπαρχουσών φυσικών πρωτεϊνών.

Στην πραγματικότητα, υπάρχουν πλέον αρκετά εργαλεία δημιουργικής τεχνητής νοημοσύνης για την πρωτεϊνική μηχανική με ονόματα όπως ProtGPT2, ProteinDT και Chroma - αλλά υπάρχουν επίσης αρκετές νεοσύστατες επιχειρήσεις (πέραν της Gingko) που επικεντρώνονται αποκλειστικά στη χρήση τεχνητής νοημοσύνης για τη δημιουργία μιας σειράς νέων πρωτεϊνών για εμπορικές αγορές, συμπεριλαμβανομένων ενζύμων, καταλυτών, συστατικών τροφίμων, φαρμακευτικών προϊόντων, βιοϋλικών, επικαλύψεων, γονιδιακής θεραπείας και άλλων. Σε ένα άλλο παράδειγμα του τρόπου με τον οποίο η AI φέρνει ασυνήθιστους τεχνολογικούς παράγοντες στη Syn Bio, η παγκόσμια εταιρεία υπηρεσιών cloud Salesforce έχει αναπτύξει το ProGEN: πρόκειται για ένα ακόμη μεγάλο γλωσσικό μοντέλο AI για τη δημιουργία νέων πρωτεϊνών. Το μοντέλο αυτό εκπαιδεύτηκε με την τροφοδοσία των αλληλουχιών αμινοξέων 280 εκατομμυρίων διαφορετικών πρωτεϊνών σε ένα μοντέλο μηχανικής μάθησης.  Στη συνέχεια, η Salesforce τελειοποίησε το μοντέλο προετοιμάζοντάς το με 56.000 αλληλουχίες από μία μόνο κατηγορία πρωτεϊνών: τα λυσοζύμια - προκειμένου να δημιουργήσει λειτουργικά νέα λυσοζύμια (που χρησιμοποιούνται, μεταξύ άλλων, για συστατικά τροφίμων). Μια έκθεση σχετικά με την εργασία αυτή στο Science Daily υπογραμμίζει πόσο τεράστιος είναι ο χώρος σχεδιασμού πρωτεϊνών για νέες παραλλαγές μόνο σε αυτή την κατηγορία πρωτεϊνών:

«Με τις πρωτεΐνες, οι επιλογές σχεδιασμού ήταν σχεδόν απεριόριστες. Τα λυσοζύμια είναι μικρές πρωτεΐνες, με περίπου 300 αμινοξέα. Αλλά με 20 πιθανά αμινοξέα, υπάρχει ένας τεράστιος αριθμός (20 στη δύναμη του 300) πιθανών συνδυασμών. Αυτός είναι μεγαλύτερος από ό,τι αν πάρουμε όλους τους ανθρώπους που έζησαν σε όλη τη διάρκεια του χρόνου, πολλαπλασιασμένος με τον αριθμό των κόκκων άμμου στη Γη, πολλαπλασιασμένος με τον αριθμό των ατόμων στο σύμπαν. Δεδομένων των απεριόριστων δυνατοτήτων, είναι αξιοσημείωτο το γεγονός ότι το μοντέλο μπορεί τόσο εύκολα να δημιουργήσει λειτουργικά ένζυμα».

Όπως σημειώθηκε, τα λυσοζύμια είναι ένα παράδειγμα συστατικών τροφίμων (η Salesforce ξεκίνησε με πρωτεΐνες αυγών) και η χρήση της τεχνητής νοημοσύνης για το σχεδιασμό νέων συνθετικών εναλλακτικών πρωτεϊνών για τις αγορές επεξεργασμένων τροφίμων ταιριάζει απόλυτα με τις φιλοδοξίες των επενδυτών που υποστηρίζουν ότι οι τεχνητές πρωτεΐνες υψηλής τεχνολογίας μπορούν να αποτελέσουν μια κερδοφόρα «κλιματική λύση» (αντικαθιστώντας τις πρωτεΐνες των ζώων) ή μια λύση για τη βιοποικιλότητα (αντικαθιστώντας την περιβαλλοντικά επιβλαβή συλλογή πρωτεϊνών από φοινικέλαιο ή ιχθυέλαιο). Υπάρχουν πολλά προβλήματα με αυτούς τους απλοϊκούς πράσινους ισχυρισμούς, αλλά αξίζει να σημειωθεί ότι ένας από τους παράγοντες που πραγματικά οδηγούν αυτές τις νέες «αγορές αλλιώτικων πρωτεϊνών» είναι οι εμπορικές ευκαιρίες που ανοίγονται από τέτοια εργαλεία πρωτεϊνικής μηχανικής - συμπεριλαμβανομένης της τεχνητής νοημοσύνης. Οι ενθουσιώδεις της alt-protein, όπως ο George Monbiot του Guardian, αρέσκονται να αναφέρονται σε αυτό το είδος συνθετικής βιοπαραγωγής ως «ζύμωση ακριβείας». Το κομμάτι «ακρίβεια» αυτού του σύντομου όρου είναι ως επί το πλείστον διαφημιστικό, αλλά αναφέρεται επίσης όλο και περισσότερο στον σχεδιασμό με βάση την τεχνητή νοημοσύνη.

Τα συστατικά τροφίμων είναι μόνο ένα κομμάτι της μελλοντικής αγοράς τεχνητών πρωτεϊνών που κυνηγούν εταιρείες όπως η Salesforce ή η Gingko. (Η Gingko έχει τη δική της εταιρεία συστατικών τροφίμων με alt-proteins που ονομάζεται Motif Foodworks). Οι εταιρείες Syn Bio αναπτύσσουν επίσης τεχνητές alt-proteins ως επικαλύψεις, γλυκαντικά, φυτοφάρμακα, κλπ - συμπεριλαμβανομένων πολλών χρήσεων που θα περιλαμβάνουν την απελευθέρωση στο περιβάλλον ή την κατάποση από τον άνθρωπο και τα ζώα αυτών των νέων πρωτεϊνικών οντοτήτων.

Cyborg #29

Πλανητικά όρια για νέες οντότητες

Από μόνη της αυτή η νέα ικανότητα της τεχνητής νοημοσύνης να παράγει ένα ευρύτερο φάσμα νέων πρωτεϊνών όλο και πιο γρήγορα για βιομηχανική χρήση θα πρέπει να θεωρηθεί ως μια δυνητικά σημαντική βιομηχανική αλλαγή στα πρότυπα παραγωγής. Πρόκειται για μια μετατόπιση που μπορεί να έχει τεράστιες επιπτώσεις στην υγεία, στις οικονομίες και στη βιοποικιλότητα μακροπρόθεσμα, όταν μια μεγαλύτερη ποικιλία τεχνητών πρωτεϊνών θα φτάσει στην αγορά, στα σώματά μας και στη βιόσφαιρα. Αυτό θα πρέπει να θέσει υψηλές απαιτήσεις όσον αφορά την παρακολούθηση, την αξιολόγηση και την υποβολή εκθέσεων, καθώς και την ανάγκη ανάπτυξης συστημάτων ανάκλησης, καθαρισμού και ευθύνης σε περίπτωση εμφάνισης προβλημάτων. Καμία από αυτές τις υποδομές δεν έχει δημιουργηθεί αυτή τη στιγμή.   Ένα ιστορικό σημείο σύγκρισης θα μπορούσε να είναι η εμφάνιση των τεχνικών της συνθετικής χημείας και η δημιουργία της συνοδευτικής συνθετικής χημικής βιομηχανίας με βάση την πετροχημεία στα τέλη του 19ου και στις αρχές του 20ου αιώνα, η οποία προήλθε από τις νέες τεχνικές «πυρόλυσης» των υδρογονανθράκων. Η παραγωγή μιας σειράς εμπορικά πολύτιμων νέων χημικών μορίων πριν από την κατάλληλη εποπτεία και ρύθμιση οδήγησε σε ταχεία διασπορά πολλών χιλιάδων διαφορετικών συνθετικών χημικών ουσιών στη βιόσφαιρα πολύ πριν από την κατάρτιση ουσιαστικών νόμων για τις τοξικές ουσίες. Πολλές από αυτές τις συνθετικές χημικές ουσίες υπόκεινται τώρα σε περίπλοκες και δύσκολες παγκόσμιες προσπάθειες καθαρισμού ή μετριασμού λόγω των απροσδόκητων βιολογικών και υγειονομικών επιπτώσεων των συνθετικών ενώσεων που αλληλεπιδρούν με τον φυσικό κόσμο.  Υπολογίζεται ότι σήμερα υπάρχουν μεταξύ 140.000- 350.000 διαφορετικών τύπων βιομηχανικών χημικών ουσιών που απελευθερώνονται στη βιόσφαιρα σε περίπου 220 δισεκατομμύρια τόνους ετησίως και ότι μόνο οι ΗΠΑ προσθέτουν περίπου 15000 νέες συνθετικές χημικές ουσίες στον κατάλογο κάθε χρόνο. Τα περισσότερα από αυτά είναι νέα για τη φύση και πολλά από αυτά είναι τοξικά σε κάποια συγκέντρωση. Στις αρχές του 2022 οι επιστήμονες ανέφεραν ότι ο άνθρωπος είχε παραβιάσει το ασφαλές «πλανητικό όριο» για τις νέες χημικές οντότητες στη βιόσφαιρα. 

Σκεφτείτε τώρα την προοπτική της απελευθέρωσης μιας νέας βιομηχανίας συνθετικών πρωτεϊνών, η οποία θα υποστηρίζεται από τεράστια κερδοσκοπικά κεφάλαια με σκοπό την τεχνητή παραγωγή μιας σειράς πρωτοφανών πρωτεϊνών για γρήγορες αποδόσεις επιχειρηματικών κεφαλαίων. Για άλλη μια φορά αυτή η βιομηχανία επιδιώκει να πραγματοποιήσει κέρδη στην αγορά πριν από τη σκόπιμη διεθνή συζήτηση και τη θέσπιση κανόνων. Αυτό θα πρέπει να εγείρει μεγάλες κόκκινες σημαίες. Το γεγονός ότι αυτή η απελευθέρωση είναι υπερφορτωμένη με την τρέχουσα επενδυτική διαφημιστική εκστρατεία για την τεχνητή νοημοσύνη είναι διπλά ανησυχητικό.  Υπενθυμίζεται ότι οι πρωτεΐνες έχουν περιγραφεί ως περίπλοκες νανομηχανές, οι αλληλεπιδράσεις των οποίων διέπουν τις περισσότερες διαδικασίες της ζωής σε μοριακό επίπεδο.  Οι συνθετικές πρωτεΐνες ως κατηγορία σύνθετων μορίων μπορεί επομένως να είναι πιο πιθανό να είναι βιολογικά ενεργές (και διαταραγμένες) από ότι οι απλές συνθετικές χημικές ενώσεις - μάλιστα μπορεί να είναι σκόπιμα σχεδιασμένες για βιομηχανικούς λόγους ώστε να επιταχύνουν, να επιβραδύνουν, να μετασχηματίζουν ή να μεταβάλλουν με άλλο τρόπο τις μοριακές βιολογικές διεργασίες στη βάση της ζωής - απαιτώντας έτσι πιο σύνθετη αξιολόγηση της ασφάλειας. Ερευνητές έχουν παρατηρήσει για παράδειγμα ότι οι συνθετικά κατασκευασμένες πρωτεΐνες εμφανίζονται πιο σταθερές από τις πρωτεΐνες που έχουν αναπτυχθεί με φυσικό τρόπο, γεγονός που μπορεί να προκαλέσει συγκρίσεις με τα προβλήματα ανθεκτικότητας ορισμένων κατηγοριών συνθετικών χημικών ουσιών.
Από την τεράστια πρόκληση της προσπάθειας αντιμετώπισης των αρνητικών επιπτώσεων των ανεκτίμητων και ανεπαρκώς κατανοητών συνθετικών χημικών ουσιών καθιερώθηκε για πρώτη φορά η Αρχή της Προφύλαξης στην περιβαλλοντική διακυβέρνηση. Η αρχή αυτή δηλώνει χονδρικά ότι είναι σκόπιμο και συνετό να αναλαμβάνουμε έγκαιρα δράση για την πρόληψη, τη ρύθμιση και τον έλεγχο μιας αναδυόμενης απειλής, ακόμη και πριν έχουμε όλα τα δεδομένα για να καταλήξουμε στην ακριβή φύση της. Η προληπτική προσέγγιση κατοχυρώνεται στο προοίμιο της σύμβασης για τη βιοποικιλότητα, καθώς και στον πρώτο στόχο (άρθρο 1) του πρωτοκόλλου της Καρθαγένης για τη βιοασφάλεια και αποτελεί επίσης την αρχή 15 της σύμβασης του Ρίο που προέκυψε από τη Σύνοδο Κορυφής για τη  Γη το 1992. Η αρχή της προφύλαξης διαμορφώθηκε ακριβώς για να αποτρέψει την ευρεία εφαρμογή τεχνολογικών εξελίξεων που προκαλούν μεγάλη αναστάτωση πριν από την κατάλληλη εποπτεία και διακυβέρνηση. Αυτή τη φορά έχουμε την ευκαιρία να την εφαρμόσουμε προτού ο αριθμός των νέων πρωτεϊνικών οντοτήτων που εισέρχονται στη βιόσφαιρα αρχίσει να μιμείται την τοξική πορεία των συνθετικών χημικών ουσιών. Εάν οι συνθετικές πρωτεΐνες γίνουν μια ταχέως αναπτυσσόμενη, δομικά ποικίλη και ευρέως διαδεδομένη κατηγορία νέων συνθετικών οντοτήτων, θα εισέλθουν στη βιόσφαιρα και θα απαιτήσουν νέες μορφές αξιολόγησης και εποπτείας της βιοασφάλειας. Αν δεν ελεγχθεί, αυτό θα επιδεινώσει περαιτέρω την υπέρβαση των πλανητικών ορίων για τις νέες οντότητες, προσθέτοντας τόσο νέες πρωτεϊνικές οντότητες όσο και νέες γονιδιωματικές οντότητες στο βιοσφαιρικό φορτίο.

Cyborg #29

Text to protein

Ακόμα πιο ανησυχητικό είναι ότι η βιομηχανική παραγωγή de novo πρωτεϊνών μέσω Syn Bio που δημιουργείται από τεχνητή νοημοσύνη μπορεί να γίνει πιο γρήγορα ευρέως διαδεδομένη, αυτοματοποιημένη και δύσκολα διαχειρίσιμη. Η εξάπλωση της βιομηχανικής χημείας επιβραδύνθηκε κάπως από την ανάγκη για μεγάλες και ακριβές εγκαταστάσεις παραγωγής. Αυτή η ευρύτερη διανομή των syn-bio-οντοτήτων θα μπορούσε να έρθει ως αποτέλεσμα των νέων εργαλείων πρωτεϊνομηχανικής ΑΙ. Ακριβώς όπως το ChatGPT έδωσε γρήγορα τη δυνατότητα σε εκατομμύρια απλούς χρήστες με ένα απλό πρόγραμμα περιήγησης στο διαδίκτυο να εισάγουν περιγραφές κειμένου σε φυσική γλώσσα προκειμένου να παράγουν συνθετικά μέσα, έτσι αναπτύσσονται νέα μοντέλα θεμελίωσης για την παραγωγή text-to-protein σε φυσική γλώσσα. Σε ένα σύστημα όπως το ProteinDT, το οποίο αυτοπροσδιορίζεται ως «πλαίσιο σχεδιασμού πρωτεϊνών καθοδηγούμενων από κείμενο», ο χρήστης μπορεί να γράψει σε φυσική γλώσσα (όπως τα αγγλικά) τα γενικά χαρακτηριστικά που θέλει να δει σε μια συνθετική πρωτεΐνη (π.χ. υψηλή θερμική σταθερότητα ή φωταύγεια). Το παραγωγικό μοντέλο τεχνητής νοημοσύνης θα δημιουργήσει στη συνέχεια πολλαπλές βιώσιμες συνθετικές πρωτεϊνικές αλληλουχίες. Αυτές μπορούν να επιλεγούν και να δημιουργηθούν από συνθετικές αλυσίδες RNA (πχ εκφρασμένες από ένα τροποποιημένο μικρόβιο ή σε ένα σύστημα χωρίς κύτταρα). Ο εξοπλισμός για τη μετατροπή αυτών των σχεδίων σε πραγματικότητα γίνεται από μόνος του όλο και πιο διαδεδομένος.

Αυτό το μοντέλο «από κείμενο σε πρωτεΐνη» θα μπορούσε να καταστήσει την εποπτεία ακόμη πιο δύσκολη. Για παράδειγμα, ένα ντοκουμέντο σχετικά με την παραγωγή text-to-protein αναγνωρίζει ότι «αν και ο σχεδιασμός πρωτεϊνών με βάση το κείμενο έχει πολλές πιθανές θετικές εφαρμογές στη γεωργία, τη βιομηχανολογία και τη θεραπευτική, μπορεί να θεωρηθεί τεχνολογία διπλής χρήσης. Όπως και τα παραγωγικά μοντέλα για μικρά μόρια, το ProteinDT θα μπορούσε να εφαρμοστεί για τη δημιουργία τοξικών ή επιβλαβών πρωτεϊνικών αλληλουχιών. Παρόλο που η δράση σε αυτά τα σχέδια θα απαιτούσε ένα εργαστήριο, η σύνθεση προσαρμοσμένων αλληλουχιών αμινοξέων είναι συνήθως απλή σε σύγκριση με τη σύνθεση νέων μικρών μορίων». Το έγγραφο σημειώνει επίσης ότι το δικό τους μοντέλο των συγγραφέων επιτρέπει τη δημιουργία δηλητηριωδών και επικίνδυνων πρωτεϊνών και ότι «οι μελλοντικές προσπάθειες για την επέκταση του εκπαιδευτικού dataset και οι βελτιώσεις της μοντελοποίησης θα μπορούσαν να αυξήσουν τον κίνδυνο διπλής χρήσης.»

Δεν είναι απαραίτητη η βιοσύνθεση δηλητηρίου φιδιού για να βλάψουν τα προϊόντα της γενετικής πρωτεϊνικής μηχανικής την ευημερία των ανθρώπων. Οι εταιρείες συνθετικής βιολογίας, όπως η Gingko, υποστηρίζουν ότι επιτρέποντας την ταχεία σχεδίαση νέων υλικών, θα είναι δυνατή η αντικατάσταση της υφιστάμενης παραγωγής που βασίζεται σε πετροχημικά με γρήγορες και ελαφρύτερες βιολογικές μεθόδους παραγωγής. Η αντικατάσταση των χημικών ουσιών που προέρχονται από το πετρέλαιο μπορεί πράγματι να είναι ένα αποτέλεσμα, αλλά θα είναι μόνο ένα από τα πολλά εμπορικά κίνητρα της τεχνολογίας. Άλλες εμπορικές οντότητες μπορεί να προσπαθήσουν να αντικαταστήσουν πολύτιμα φυσικά προϊόντα που σήμερα καλλιεργούνται από μικρούς αγρότες ή να εκτοπίσουν προϊόντα που προέρχονται από δάση ή θάλασσες - αλλάζοντας τα πρότυπα χρήσης της γης και των ωκεανών και επηρεάζοντας τα μέσα διαβίωσης των αγροτών και των αλιέων.

Έχουμε ήδη δει ότι οι πρώτοι εμπορικοί στόχοι για την παραγωγή συνθετικής βιολογίας ήταν ακριβώς αυτές οι υψηλής αξίας φυσικές γεύσεις, αρώματα, συστατικά καλλυντικών, έλαια, μπαχαρικά και υφάσματα που καλλιεργούνται, συλλέγονται και διαχειρίζονται από μικρούς αγρότες και αυτόχθονες πληθυσμούς. Όταν εργαζόμουν για τον όμιλο ETC οι πρώην συνάδελφοί μου και εγώ περάσαμε χρόνια καταγράφοντας παραδείγματα εταιρειών συνθετικής βιολογίας που βιοσυνθέτουν (ή όπως λένε τώρα κάποιοι «κάνουν ζύμωση ακριβείας») φυσικά προϊόντα. Σε αυτά περιλαμβάνονταν η βανίλια, η στέβια, το μετάξι, ο κρόκος, η αρτεμισίνη, το λάδι καρύδας, το πορτοκαλέλαιο και πολλά άλλα σημαντικά, πολιτισμικά ευαίσθητα αγαθά από τα οποία εξαρτώνται οι πιο ευάλωτοι άνθρωποι του κόσμου για τα προς το ζην και τον πολιτισμό τους. Στην έκθεση «Synthetic Biology, Biodiversity & Farmers» [https://www.etcgroup.org/content/synthetic-biology-biodiversity-farmers] που δημοσιεύσαμε το 2016, η οποία αναδεικνύει 13 μελέτες περιπτώσεων φυσικών προϊόντων που θα μπορούσαν να διαταραχθούν από τη συνθετική βιοπαραγωγή - η οποία μπορεί επίσης να έχει σοβαρές επιπτώσεις στη διατήρηση της βιοποικιλότητας, δεδομένου ότι οι μικροκαλλιεργητές και οι αυτόχθονες κοινότητες αποτελούν συχνά τη βάση των επί τόπου κοινοτικών προσπαθειών διατήρησης. Διαπιστώσαμε ότι από τις 200 έως 250 διαφορετικές βοτανικές καλλιέργειες που χρησιμοποιούνται από τη βιομηχανία τροφίμων και αρωμάτων, το 95% αυτών προέρχεται από μικρής κλίμακας αγρότες και γεωργικούς εργάτες κυρίως στον παγκόσμιο Νότο. Συνολικά εκτιμάται ότι 20 εκατομμύρια αγρότες και γεωργοί μικρής κλίμακας εξαρτώνται από βοτανικές καλλιέργειες που καλλιεργούνται για φυσικές γεύσεις και αρώματα κι αυτή είναι μια συντηρητική εκτίμηση. Οι ίδιοι οι εμπορικοί όμιλοι της βιομηχανίας αρωμάτων και γεύσεων αναγνωρίζουν ότι αυτά τα βότανα είναι «εξαιρετικά σημαντικά όσον αφορά τον κοινωνικοοικονομικό αντίκτυπό τους στους αγροτικούς πληθυσμούς και μπορεί επίσης να έχουν σημαντικά περιβαλλοντικά οφέλη εντός των γεωργικών συστημάτων».

Το 2016, όταν ερευνούσα αυτές τις βιολογικές εφαρμογές, παρατηρούσα όλο και περισσότερο ότι η διαταραχή των παραδοσιακών φυσικών προϊόντων δεν προερχόταν απλώς από τις δεξαμενές με τα ζυμωμένα μικρόβια που συνθέτουν εναλλακτικές ενώσεις. Προερχόταν επίσης από νέα βιομηχανικά ένζυμα που μπορούσαν να μετατρέψουν ένα προϊόν χαμηλής αξίας σε κάτι άλλο με υψηλή αξία. Για παράδειγμα, ένας βασικός στόχος των εταιρειών συνθετικής βιολογίας εκείνη την εποχή ήταν η προσπάθεια να κατευθύνουν την γενετικά τροποποιημένη ζύμη, που τρέφεται με ζάχαρη, να παράγει μεγάλες ποσότητες γλυκαντικών ενώσεων που ονομάζονται rebaudiosides και βρίσκονται στη στέβια.  Η πιο εμπορική στέβια έχει υψηλή περιεκτικότητα σε ένα rebaudioside που ονομάζεται Reb A, το οποίο δίνει στη φυσική στέβια τη χαρακτηριστική μεταλλική της γεύση ως συστατικό γλυκαντικού. Ωστόσο, υπάρχουν πολύ μικρότερες ποσότητες Reb D και Reb M, οι οποίες είναι πολύ πιο γλυκές αλλά υπάρχουν μόνο σε μικρές ποσότητες στα φύλλα της φυσικής στέβιας. Ενώ ορισμένες εταιρείες, όπως η Cargill και η Evolva, μηχανεύονταν ενεργά ζύμες για να παράγουν ποσότητες Reb D και Reb M σε δεξαμενές ζύμωσης, άλλες παρήγαγαν μια γενετικά τροποποιημένη ενζυμική πρωτεΐνη που θα μπορούσε να μετατρέψει τις μεγάλες ποσότητες Reb A που καλλιεργούνταν ήδη στα χωράφια σε Reb M. Εκ πρώτης όψεως αυτή η ενζυμική «βιομετατροπή» μπορεί να φαίνεται καλό πράγμα: οι αγρότες στέβιας θα μπορούσαν να συνεχίσουν να καλλιεργούν φύλλα στέβιας, αλλά οι καταναλωτές θα είχαν στο τέλος ένα πιο γλυκό προϊόν. Αυτό ήταν βεβαίως το επιχείρημα που προέβαλε η κορυφαία εταιρεία Stevia Pure Circle σχετικά με την προσέγγιση των μηχανικών ενζύμων.

Αλλά η ίδια ενζυμική προσέγγιση μπορεί επίσης να χρησιμοποιηθεί για τον σχεδιασμό μηχανικών ενζύμων και πρωτεϊνών που βιομετατρέπουν εντελώς άσχετες πρώτες ύλες σε συστατικά υψηλής αξίας. Για παράδειγμα, η Ambrosia Bio, μια εταιρεία συνθετικής βιολογίας, συνεργάζεται με την Gingko Bioworks. Τα ΑΙ εργαλεία της σχεδιασμού πρωτεϊνών για τη δημιουργία μηχανικών ενζύμων, μετατρέπουν χαμηλού κόστους σάκχαρα και άμυλα σε αλλουλόζη, ένα γλυκαντικό χαμηλών θερμίδων που ανταγωνίζεται τη στέβια, η οποία συνήθως βρίσκεται σε μικρές ποσότητες στα σύκα, τις σταφίδες και το σιρόπι σφενδάμου. Η αλλουλόζη έχει την ιδιαίτερη ιδιότητα να μην ανεβάζει τα επίπεδα γλυκόζης και ινσουλίνης στο αίμα, ενώ η γεύση της μοιάζει πολύ με τη ζάχαρη. Μια έκθεση αναλυτών υποστηρίζει προκλητικά ότι η βιομηχανία αλλουλόζης είναι πιθανό να είναι «η ταχύτερα αναπτυσσόμενη βιομηχανία το 2031». Στην πραγματικότητα η Ambrosia Bio απλώς αντιγράφει αυτό που οι περισσότεροι παραγωγοί αλλουλόζης κάνουν ήδη - συμπεριλαμβανομένου του γίγαντα της ζάχαρης Tate and Lyle. Χρησιμοποιούν επίσης γενετικά τροποποιημένα ένζυμα για να μετατρέψουν το άμυλο καλαμποκιού και σιταριού σε αυτό το νέο σούπερ συστατικό χαμηλών θερμίδων. Σε μια άλλη πραγματικότητα, η αλλουλόζη θα μπορούσε να είναι μια ευκαιρία για τους παραγωγούς σταφίδας, σύκου και σφενδάμου να δημιουργήσουν νέες αγορές γλυκαντικών με χαμηλές θερμίδες. Αντ’ αυτού, η παραγωγή syn-bio-πρωτεϊνών σημαίνει ότι έχει καταληφθεί εξ ολοκλήρου από τα μεγάλα αγροτικά και βιοτεχνολογικά συμφέροντα.

Βιοπειρατεία AI

Αλλά η απώλεια αυτών των οικονομικών ευκαιριών [για τις τοπικές κοινότητες] δεν αφορά μόνο την τεχνητή νοημοσύνη και τη γονιδιωματική καινοτομία. Βασίζεται επίσης σε μια μεγάλη κλοπή γονιδιωματικών δεδομένων. Θυμάστε εκείνα τα εκατοντάδες εκατομμύρια γονιδιωμάτων και τα εκατομμύρια πρωτεϊνικών αλληλουχιών στα οποία η Nvidia, η Salesforce, η Gingko και άλλοι εκπαίδευσαν τα μεγάλα γλωσσικά μοντέλα τους; Δεν συλλέχθηκαν από την Nvidia ή την Salesforce μέσω συμφωνιών αμοιβαίας χρήσης με αγρότες, χωρικούς και ούτω καθεξής. Είναι το αποτέλεσμα δεκαετιών ύπουλης βιοεξερεύνησης και βιοπειρατείας - λήψης δειγμάτων και αλληλούχισης γονιδιωματικού υλικού από πολλές χιλιάδες τοποθεσίες και κοινότητες και μεταφόρτωσης αυτών των ψηφιακών αλληλουχιών σε βάσεις δεδομένων.

Τα βιολογικά υλικά αποτελούν την κοινή κληρονομιά της ανθρωπότητας και προέρχονται από συγκεκριμένες κοινότητες που διαχειρίστηκαν, ανέπτυξαν, προστάτευσαν, ανέπτυξαν και συν-εξελίχθηκαν με τη βιολογική ποικιλομορφία και οι οποίες μπορούν να θεωρηθούν ότι έχουν εγγενή δικαιώματα και σχέσεις ως προς τον τρόπο χρήσης αυτών των γενετικών πόρων. Κατά το τελευταίο τέταρτο του αιώνα τα κινήματα των αυτοχθόνων πληθυσμών, οι αγρότες και οι κυβερνήσεις του Νότου έχουν δώσει συνεχείς μάχες στους διαδρόμους του Οργανισμού Σύμβασης για τη Βιολογική Ποικιλότητα, του Οργανισμού Τροφίμων και Γεωργίας, του Παγκόσμιου Οργανισμού Πνευματικής Ιδιοκτησίας, του Παγκόσμιου Οργανισμού Υγείας και άλλων φορέων για να αναγνωριστούν τα εγγενή δικαιώματά τους στο γενετικό υλικό και να σταματήσουν την κλοπή γενετικού υλικού από τα συμφέροντα της βιοτεχνολογίας. Η μάχη αυτή έχει γεννήσει μια παγκόσμια «Συνθήκη για τους σπόρους» για τους φυτογενετικούς πόρους και το Πρωτόκολλο της Ναγκόγια για την πρόσβαση και τον επιμερισμό των οφελών των γενετικών πόρων. Τα τελευταία χρόνια η ύπαρξη μεγάλων ψηφιακών γονιδιωματικών βάσεων δεδομένων έχει αναγάγει αυτή τη μάχη σε μάχη βορρά εναντίον νότου για τη δίκαιη και ισότιμη διακυβέρνηση των πληροφοριών ψηφιακής αλληλουχίας (Digital Sequence Information ή DSI) των γενετικών πόρων - δηλαδή των ίδιων των ψηφιακών αλληλουχιών DNA στις οποίες οι τιτάνες της τεχνητής νοημοσύνης βασίζουν τώρα τα επιχειρηματικά τους σχέδια.

Επειδή είναι βέβαιο ότι σε κανένα σημείο, όταν οι βιοερευνητές ή οι πανεπιστημιακοί ερευνητές βιοτεχνολογίας έπαιρναν αλληλουχίες DNA από τις κοινότητες του Νότου, δεν ρωτήθηκε η τοπική κοινότητα πώς αισθανόταν για τη μετατροπή της γενετικής της κληρονομιάς σε ψηφιακό κώδικα, τη μεταφόρτωση σε μεγάλα γλωσσικά μοντέλα και τη χρήση τους από την generative AI για την κατασκευή συνθετικών εναλλακτικών λύσεων που θα μπορούσαν να πωληθούν για ιδιωτικό κέρδος. Αυτή η προαπαιτούμενη πράξη της ελεύθερης και ενημερωμένης συναίνεσης απλά δεν συνέβη ποτέ. Ωστόσο, είναι οι κοινοί πόροι που έχουν αφαιρεθεί από αυτές τις κοινότητες που χρησιμοποιούνται τώρα για να τροφοδοτήσουν τα αναμενόμενα υπερκέρδη των εταιρειών τεχνολογίας AI. Η ανάδειξη της αυτοματοποιημένης γενετικής μηχανικής που καθοδηγείται από την τεχνητή νοημοσύνη ως μια βιομηχανική ευκαιρία είναι το αποκορύφωμα του γιατί οι εταιρείες βιοτεχνολογίας και τα βιομηχανικά κράτη πολέμησαν τόσο σκληρά ενάντια στο να δώσουν στις κοινότητες δικαιώματα στους δικούς τους παραδοσιακούς βιολογικούς πόρους.

Υπάρχει μια σχεδόν ακριβής παραλληλία με τις νομικές και ηθικές μάχες που δεν ξεσπούν γύρω από την εμπορική τέχνη που παράγει η AI. Κείμενο και βίντεο που βασίζονται σε κλεμμένη, απλήρωτη εργασία πραγματικών καλλιτεχνών, συγγραφέων, ηθοποιών και άλλων. Όταν το Dall-E ή το MidJourney «παράγει» μέσω ΑΙ ένα νέο έργο τέχνης - αυτό που πραγματικά κάνει είναι να αναμειγνύει στοιχεία από εικόνες εκατομμυρίων υφιστάμενων έργων τέχνης που έχουν εισαχθεί στα data που χρησιμοποιεί η μηχανική εκπαίδευση. Ωστόσο, δεν γίνεται καμία απόδοση ή εμπορική αποπληρωμή σε εκείνους των οποίων η καλλιτεχνική εργασία αξιοποιείται, ούτε καν αναγνωρίζονται οι αρχικοί καλλιτέχνες των οποίων το έργο έχει κλαπεί, χρησιμοποιηθεί, αναμειχθεί και ενσωματωθεί στο νέο «έργο τέχνης» της τεχνητής νοημοσύνης.

[...]

Υπάρχουν πλέον διαδικτυακά εργαλεία, όπως το haveibeentrained.com, που επιτρέπουν στους καλλιτέχνες να αναζητήσουν τα μεγαλύτερα σύνολα δεδομένων τεχνητής νοημοσύνης για να διαπιστώσουν αν τα έργα τους περιλαμβάνονται σε αυτά και να επιμείνουν στην αφαίρεσή τους. Ωστόσο, δεν υπάρχει παρόμοια διαδικασία για τις κοινότητες να διερευνήσουν σύνολα δεδομένων DNA για να δουν αν το κλεμμένο γενετικό υλικό τους χρησιμοποιείται από τη τεχνητή νοημοσύνη για τη δημιουργία εταιρικών οργανισμών syn-bio, πρωτεϊνών και άλλων εμπορικών προϊόντων.  Οι υφιστάμενες διαδικασίες στο πλαίσιο της Σύμβασης για τη Βιολογική Ποικιλότητα και της Συνθήκης για τους Σπόρους πρέπει επειγόντως να υπολογίσουν τις επιπτώσεις της generative AI στην ήδη πικρή πολιτική των ψηφιακών πληροφοριών ακολουθίας - προκειμένου να υπερασπιστούν τα δικαιώματα και τις οικονομίες των φτωχότερων και πιο ευάλωτων ανθρώπων του κόσμου. Για παράδειγμα, αυτό το μήνα [Ιανουάριος ‘24] ξεκινά μια διαδικασία στο πλαίσιο της Σύμβασης για τη Βιοποικιλότητα, για τη δημιουργία πολυμερούς μηχανισμού για τον επιμερισμό των οφελών από τη χρήση των ψηφιακών πληροφοριών ακολουθίας (DSI) για τους γενετικούς πόρους. Αν ο μηχανισμός αυτός δεν αντιμετωπίσει τη συγκέντρωση και τη χρήση του ψηφιακού DNA από τα μοντέλα τεχνητής νοημοσύνης (και δεν βάλει τις εταιρείες DNA-ΑΙ και τους παραγωγούς πρωτεϊνών τεχνητής νοημοσύνης να πληρώσουν), θα έχει χάσει εντελώς το νόημα.

Παρά την καθημερινή πληθώρα ιστοριών σχετικά με την τεχνητή νοημοσύνη, η αναφορά και η ανάλυση των μέσων μαζικής ενημέρωσης σχετικά με τη σύγκλιση AI / Syn-bio είναι ακόμη αρκετά ισχνή. Όπου συμβαίνει, είναι συνήθως ο εμπορικός και επενδυτικός τύπος που επικεντρώνεται στις οικονομικές υποσχέσεις και ελπίδες των ιδρυτών νεοφυών επιχειρήσεων και της έξυπνης αλγοριθμικής επιστήμης τους. Τελικά όμως οι περισσότεροι άνθρωποι ψάχνουν σε λάθος μέρος.  Ο πραγματικός αντίκτυπος της σύγκλισης της τεχνητής ζωής με την τεχνητή νοημοσύνη θα γίνει αισθητός αλλού, στα χωράφια των αγροτών του παγκόσμιου Νότου ή ακόμη και στις γεωργικές παραγωγικές περιοχές του Βορρά. Αν φτάσουμε στο σημείο όπου οι εταιρείες συνθετικής βιολογίας ή οι βιομηχανικοί πελάτες τους θα μπορούν αξιόπιστα να πληκτρολογούν «σχεδίασε μου μια πρωτεΐνη σαν μετάξι» σε μια γραμμή εντολών από κείμενο σε πρωτεΐνη τόσο εύκολα όσο οι γραφίστες μπορούν τώρα να πληκτρολογούν «ζωγράφισε μου μια εικόνα του μεταξιού» στο Midjourney, τότε οι παγκόσμιες οικονομίες παραγωγής μπορεί να μετατοπιστούν επιζήμια και ακόμη πιο μακριά από τη δικαιοσύνη.

Τίτλος πρωτότυπου: The Artificial Intelligence / Artificial Life convergence. Part 1: When AI Bots do Genetic Engineering, 11/01/2024

Συγγραφέας: Jim Thomas

Πηγή: https://www.scanthehorizon.org/p/dnai-the-artificial-intelligence

Μετάφραση: Harry Tuttle

Σημείωση

1 - Για περισσότερα: Συνθετική βιολογία και μοριακός προγραμματισμός: τα κύτταρα ως αλυσίδα της (ανα-)παραγωγής, Cyborg νο 5, Φλεβάρης 2016 - Συνθετική βιολογία, η γενεαλογία: η ζωή είναι φτηνη!, Cyborg νο 20, Φλεβάρης 2021. [ επιστροφή ]

κορυφή