Ο πραγματικός λόγος που η Silicon Valley τρέμει το DeepSeek -

Της Parmy Olson από το capital.gr

Από τότε που λάνσαρε το ChatGPT πριν από δύο χρόνια, ο διευθύνων σύμβουλος της OpenAI, Σαμ Άλτμαν, υποστηρίζει ότι η επιχείρησή του τροφοδοτείται από μερικά βασικά συστατικά: τσιπ, δεδομένα και χρήματα. Όσο περισσότερα από αυτά τα τρία στοιχεία διοχετεύετε στην εταιρεία του, όπως το κάρβουνο σε μια ατμομηχανή, τόσο πιο ισχυρή Τεχνητή Νοημοσύνη θα παράγει. Μια μικροσκοπική εταιρεία από την Κίνα με την ονομασία DeepSeek έρχεται τώρα να ανατρέψει αυτή τη φόρμουλα, με ένα μοντέλο Τεχνητής Νοημοσύνης που είναι εξίσου ισχυρό, αλλά κατασκευασμένο για ένα μόνο κλάσμα του κόστους. Αυτή η ιστορία του Δαβίδ και του Γολιάθ αναδεικνύει όμως κάτι παραπάνω από μία μόνο εταιρεία — ή ακόμα και την Κίνα.

Σε ολόκληρο τον κόσμο, κατασκευάζονται παρόμοια μοντέλα ανοιχτού κώδικα, έτοιμα να κατακτήσουν το μερίδιο αγοράς του Άλτμαν με συστήματα που είναι πολύ φθηνότερα ή ακόμη και δωρεάν για χρήση. Αυτή είναι μια ανησυχητική προοπτική για επιχειρήσεις όπως η OpenAI και η Anthropic, των οποίων η πρωταρχική οδός προς την κερδοφορία είναι η πώληση της πρόσβασης σε ένα θεμελιώδες μοντέλο (foundation model) σε υψηλότερη τιμή. (Η Google της Alphabet και η Microsoft έχουν τουλάχιστον επιχειρήσεις cloud και λογισμικού στις οποίες μπορούν να βασιστούν). Τα ανοιχτά μοντέλα όπως το DeepSeek μπορεί να μην επικρατήσουν στο τέλος, αλλά θα μπορούσαν να κερδίσουν ένα ανησυχητικά μεγάλο μερίδιο της πίτας και να εκπληρώσουν τις υποσχέσεις που ο Άλτμαν έχει παραμελήσει σχετικά με την “ανοικτότητα” [σσ. εξού και το όνομα…] και τη συνεργατικότητα.

“Το έγγραφο της DeepSeek σχετικά με [το νέο μοντέλο AI της, γνωστό ως] R1 ήταν πιο διαφανές από οτιδήποτε έχω δει [να δημοσιεύεται] από το OpenAI μετά το GPT-3”, λέει ο Γκάρι Μάρκους, ομότιμος καθηγητής του Πανεπιστημίου της Νέας Υόρκης, ο οποίος έχει θίξει εδώ και πολύ καιρό την αδιαφάνεια της OpenAI και προειδοποιήσει για μια κατάρρευση της αγοράς Τεχνητής Νοημοσύνης.

Αυτή η ανοιχτή πρόσβαση είναι μέρος της αλλαγής που συμβαίνει στην Κίνα. Η DeepSeek ιδρύθηκε από έναν επιχειρηματία hedge fund, τον Λιάνγκ Γουενφένγκ, ο οποίος συγκέντρωσε τους πρώην υπαλλήλους του και δεκάδες διδακτορικούς απόφοιτους κινεζικών πανεπιστημίων για να προσπαθήσουν να δημιουργήσουν Τεχνητή Νοημοσύνη [που να πλησιάσει το] ανθρώπινο επίπεδο [νοημοσύνης]. Στη συνέχεια αξιοποίησε 10.000 τσιπ που απέκτησε από την Nvidia το 2021 (πριν από την επιβολή περιορισμών στις εξαγωγές τσιπ από τις ΗΠΑ), χρησιμοποιώντας, σύμφωνα με πληροφορίες, το 1/50 της υπολογιστικής ισχύος που διαθέτουν τεχνολογικοί κολοσσοί όπως η Google, η Microsoft και η OpenAI.

Αυτή την εβδομάδα αποτελεσμάτων, καθώς αυτές οι εταιρείες προσπαθούν να εξηγήσουν στους επενδυτές τα εντυπωσιακά υψηλά ποσά των κεφαλαιουχικών δαπανών τους για την Τεχνητή Νοημοσύνη, θα κάνουν ό,τι μπορούν για να προσφέρουν κάποια ελπίδα. Και αφού ανησύχησαν για τις φθίνουσες αποδόσεις των λεγόμενων νόμων κλίμακας που διέπουν τη “more-is-better” φόρμουλα του Άλτμαν, τώρα έχουν στα χέρια τους τον “χάρτη” για να παρακάμψουν αυτές τις απαιτήσεις, χάρη στην DeepSeek.

Η κινεζική εταιρεία έχει δημοσιεύσει τα περισσότερα στοιχεία σχετικά με το R1 στο διαδίκτυο, κάτι που δεν θα έκαναν σήμερα η OpenAI και η Google. Το επίτευγμά της είναι ουσιαστικά μια νέα προσέγγιση στη λεγόμενη ανταποδοτική μοντελοποίηση, σύμφωνα με μια περίληψη των ευρημάτων. Οι μηχανικοί της Meta μελετούν ήδη αυτές τις λεπτομέρειες και τις επόμενες εβδομάδες και μήνες θα μπορούσαμε να δούμε τον Μαρκ Ζούκερμπεργκ και τους μεγάλους τεχνολογικούς ομολόγους του να κυκλοφορούν νέα μοντέλα Τεχνητής Νοημοσύνης που θα είναι πολύ πιο αποτελεσματικά.

Αυτό δεν θα είναι απλό, καθώς το DeepSeek, τεχνικά, δεν είναι “ανοικτού κώδικα”, σύμφωνα με την Πρωτοβουλία Ανοικτού Κώδικα (OSI), μια παγκόσμια αρχή που πιστοποιεί τις άδειες χρήσης λογισμικού. “Δεν παρέχουν τον πηγαίο κώδικα για την επεξεργασία και το φιλτράρισμα και την εκπαίδευση των δεδομένων, ούτε τις πληροφορίες σχετικά με τα δεδομένα εκπαίδευσης”, μου λέει ένας εκπρόσωπος της OSI. “Άλλοι θα πρέπει να το φτιάξουν αυτό από το μηδέν, βασιζόμενοι αποκλειστικά στο έγγραφο που δημοσίευσαν”.

Αλλά ως ένα λεγόμενο σύστημα open-weight, το DeepSeek μπορεί ακόμα να παρέχει τις κρίσιμες παραμέτρους του μοντέλου που άλλοι μπορούν να αντιγράψουν και να βελτιώσουν, σε αντίθεση με την OpenAI, η οποία κρατά τα μοντέλα της κλειδωμένα σε ένα μαύρο κουτί.

Το ίδιο το DeepSeek βασίστηκε στη δουλειά άλλων. Η εταιρεία λέει ότι η Τεχνητή Νοημοσύνη της χτίστηκε στο μοντέλο Llama της Meta. Η Microsoft εξετάζει επίσης αν η DeepSeek κατασκεύασε την Τεχνητή Νοημοσύνη της με τη βοήθεια της τεχνολογίας της OpenAI, έστω και χωρίς την κατάλληλη άδεια, προκαλώντας πιθανώς αναστάτωση στο Σαν Φρανσίσκο. (Μην στεναχωριέστε πολύ για την OpenAI, μια εταιρεία που ξήλωσε το έργο που προστατεύεται από πνευματικά δικαιώματα χιλιάδων καλλιτεχνών και συγγραφέων για το δικό της εμπορικό όφελος).

Τα δωρεάν, εξαιρετικά ικανά συστήματα Τεχνητής Νοημοσύνης δεν σταματούν στο DeepSeek. Υπάρχουν και άλλα προϊόντα AI ανοιχτού κώδικα που προέρχονται από την Κίνα, όπως το YuE, το οποίο δημιουργεί ολόκληρα μουσικά κομμάτια και τραγούδια, και το Qwen της Alibaba, το οποίο δημιουργεί βοηθούς ΑΙ.

Η στροφή της Κίνας προς τη δημιουργία μοντέλων ανοιχτού κώδικα έχει επέλθει τα τελευταία χρόνια, λόγω των αμερικανικών ελέγχων στις εξαγωγές, της κυβερνητικής υποστήριξης και της επιρροής του μοντέλου open-weight της Meta, του Llama, το οποίο αρκετές κινεζικές εταιρείες τεχνολογίας έχουν με ενθουσιασμό τελειοποιήσει για τις δικές τους εφαρμογές, σύμφωνα με το Computer Weekly.

Για τους εδραιωμένους κολοσσούς της Silicon Valley, η πραγματική απειλή δεν είναι μόνο η Κίνα, αλλά ο τρόπος με τον οποίο οι κινεζικές τεχνολογικές εταιρείες θα μπορούσαν να τροφοδοτήσουν ακόμη μεγαλύτερη δυναμική υπέρ του κινήματος ανοιχτού κώδικα σε άλλα μέρη του κόσμου – όπως η Γαλλία, όπου εδρεύουν οι πολλά υποσχόμενες εταιρείες ανοιχτού κώδικα Τεχνητής Νοημοσύνης Mistral AI και Hugging Face, και οι ΗΠΑ, όπου η ερευνητική κολεκτίβα EleutherAI έχει επηρεάσει τη δημιουργία μοντέλων όπως το GPT-J και το GPT-NeoX.

Φυσικά, η Τεχνητή Νοημοσύνη ανοικτού κώδικα έχει και μειονεκτήματα, με ένα από αυτά την κατάχρηση από κακόβουλους χρήστες. Και ενώ το νέο μοντέλο της DeepSeek έχει λύσει το πρόβλημα του κόστους, δεν έχει λύσει άλλα θέματα. Υπάρχουν πολλά παραδείγματα στα μέσα κοινωνικής δικτύωσης από χρήστες που “έσπασαν” το R1 για να παρακάμψουν τα φιλικά προς το Κινεζικό Κομμουνιστικό Κόμμα φίλτρα του. Και ενώ το μοντέλο ήταν φθηνό για να κατασκευαστεί, εξακολουθεί να είναι σχετικά ακριβό λειτουργικά, επισημαίνει ο Μάρκους.

Ωστόσο, το DeepSeek προσδίδει νέα αξιοπιστία στην Τεχνητή Νοημοσύνη ανοιχτού κώδικα μεταξύ των κατασκευαστών λογισμικού. Οι προγραμματιστές σε φόρουμ όπως το X επιδεικνύουν όλες τις εφαρμογές που κατασκευάζουν στην δωρεάν πλατφόρμα του DeepSeek. Κάποιος είπε ότι τη χρησιμοποίησε για να κλωνοποιήσει τη μηχανή AI Perplexity χωρίς να γράψει κώδικα. Ένας άλλος προγραμματιστής είπε ότι αξιοποίησε το R1 για να δημιουργήσει μια εφαρμογή που σας επιτρέπει να κάνετε ερωτήσεις για οποιοδήποτε αρχείο PDF.

Η επιχείρηση της OpenAI για τη δημιουργία θεμελιωδών μοντέλων έχει γίνει εμπόρευμα. Οι πραγματικές οικονομικές δυνατότητες υπάρχουν τώρα για εκείνους που δημιουργούν προϊόντα πάνω σε όλη αυτή την υποδομή ή πάνω σε πλατφόρμες όπως αυτή της DeepSeek που είναι δωρεάν στη χρήση.

Η ειρωνεία είναι τεράστια. Όταν η OpenAI ξεκίνησε το 2015, υποσχέθηκε να “συνεργάζεται ελεύθερα” και να μοιράζεται τις πατέντες της με τον κόσμο. Αντ’ αυτού, στη φιλόδοξη προσπάθειά της για τη δημιουργία Τεχνητής Νοημοσύνης σε επίπεδο ανθρώπινης νοημοσύνης άρχισε να μεταμορφώνεται σε αυτό ακριβώς που είχε ως στόχο να διαταράξει: έναν αδιαφανή, διψασμένο για χρήμα τεχνολογικό κολοσσό, ο οποίος τώρα αμφισβητείται από την πραγματικά ανοιχτή Τεχνητή Νοημοσύνη.

Ο Άλτμαν έπεισε τον κόσμο ότι η δημιουργία ισχυρής Τεχνητής Νοημοσύνης απαιτεί τεράστιους πόρους, αλλά τώρα μαθαίνει ότι η “τάφρος” που έχτισε δεν είναι τελικά τόσο βαθιά. Ίσως το μέλλον να μην ανήκει σε εκείνους που μπορούν να ξοδέψουν τα περισσότερα, αλλά σε εκείνους που τολμούν να μοιραστούν τα ευρήματά τους με τον κόσμο.

Απόδοση – Επιμέλεια: Λυδία Ρουμποπούλου

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

«Ημέρα της Οργής» Οι απαρχές του συριακού εμφυλίου πολέμου

6 Νοεμβρίου 2015
H κατάρρευση του κυβερνητικού συνασπισμού και η επόμενη μέρα για την Γερμανία

8 Νοεμβρίου 2024
Το νέο «Μεγάλο Παιχνίδι» μετά την πτώση της Καμπούλ και η σφήνα της Τουρκίας

19 Αυγούστου 2021
Πόσοι νεκροί, για έναν δικτάτορα;

19 Μαρτίου 2017
Βέλγιο: Τρομοκρατία και μουσουλμανική κοινότητα

28 Μαρτίου 2016
Η κάλπικη νίκη του Ερντογάν

18 Απριλίου 2017

Ο πραγματικός λόγος που η Silicon Valley τρέμει το DeepSeek

Κοινοποιήσεις:

ΣΧΕΤΙΚΑ

ΑΦΗΣΤΕ ΕΝΑ ΣΧΟΛΙΟ Cancel Reply