Ποια είναι η DeepSeek που θέτει εν αμφιβόλω την αμερικανική κυριαρχία στην Τεχνητή Νοημοσύνη
InBusinessNews 10:50 - 31 Ιανουαρίου 2025
Η επιτυχημένη εμφάνιση του κινεζικού μοντέλου Τεχνητής Νοημοσύνης (ΤΝ) χαμηλού κόστους της εταιρείας DeepSeek, έθεσε εν αμφιβόλω την τεχνολογική κυριαρχία που οραματίζονται οι Αμερικανοί, δήλωσε στο ΚΥΠΕ ο Δρ Μάριος Δικαιάκος, Καθηγητής Πληροφορικής στο Πανεπιστήμιο Κύπρου.
Η DeepSeek ανακοίνωσε αυτή την εβδομάδα ότι το κόστος προετοιμασίας του μοντέλου της είναι κατά πολύ χαμηλότερο από το αμερικανικό ChatGPT της OpenAI, που θεωρείται ως το καλύτερο στη βιομηχανία μέχρι τώρα. Ανακοίνωσε ακόμη ότι το μοντέλο της έχει συγκρίσιμες επιδόσεις με τα μοντέλα της OpenAI. Εγινε επίσης γνωστό ότι οι τηλεφορτώσεις του κινεζικού μοντέλου είχαν ξεπεράσει εκείνες του ChatGPT. Ως αποτέλεσμα, οι αμερικανικές μετοχές εταιρειών υψηλής τεχνολογίας γνώρισαν μια ιστορική πτώση την Δευτέρα 27 Ιανουαρίου φέρνοντας τα πάνω – κάτω στον τομέα της ΤΝ.
Ο κ. Δικαιάκος είπε στο ΚΥΠΕ ότι είχε δημιουργηθεί μία φούσκα με τις αξίες κάποιων μετοχών, συμπληρώνοντας ότι η μετοχή της Nvidia είχε εκτοξευθεί και μετά τις ανακοινώσεις της DeepSeek έγινε η διόρθωση φέροντας τα πράγματα πιο κοντά στην πραγματικότητα.
Εκτίμησε ότι παρά τις απαγορεύσεις εξαγωγών που επέβαλαν οι ΗΠΑ στην Κίνα σε ό,τι αφορά επεξεργαστές πολύ υψηλής τεχνολογίας και επίδοσης που σχεδιάζονται από την Nvidia, η τεχνολογική πρόοδος στην Κίνα ήταν αναμενόμενη.
Τί είναι η DeepSeek και ποια η διαφορά της
Η DeepSeek είναι μια κινέζικη εταιρεία η οποία δημοσιοποίησε μία εφαρμογή τεχνητής νοημοσύνης και μοντέλα παραγωγικής τεχνητής νοημοσύνης στα οποία δίνεται πρόσβαση μέσω διαδικτύου σε πολύ χαμηλό κόστος ή και δωρεάν.
«Ουσιαστικά» είπε ο κ. Δικαιάκος στο ΚΥΠΕ, «το μοντέλο κάνει τα ίδια πράγματα με τα πιο γνωστά γλωσσικά μοντέλα τα οποία έχουν λάβει μεγάλη δημοσιότητα όπως το Chat GPT, το Llama, το Gemini και άλλα».
Την περασμένη εβδομάδα, η κινεζική startup DeepSeek παρουσίασε έναν δωρεάν βοηθό τεχνητής νοημοσύνης που χρησιμοποιεί λιγότερα δεδομένα με ένα κλάσμα του κόστους των γνωστών υπηρεσιών όπως η Chat GPT.
Σύμφωνα με έκθεση του πρακτορείου Ρόιτερς, μέχρι τη Δευτέρα, το πρόγραμμα της DeepSeek είχε ξεπεράσει τον ανταγωνιστή των ΗΠΑ ChatGPT στις λήψεις από το κατάστημα εφαρμογών της Apple.
Η DeepSeek εδρεύει στο Hangzhou και κύριος μέτοχος είναι ο Liang Wenfeng.
Σύμφωνα με το Ρόιτερς, στις 20 Ιανουαρίου, την ημέρα που το DeepSeek-R1 κυκλοφόρησε στο κοινό, ο ιδρυτής της κ. Liang παρευρέθηκε σε ένα συμπόσιο κεκλεισμένων των θυρών με επιχειρηματίες και ειδικούς που διοργανώθηκε από τον Κινέζο Πρωθυπουργό Li Qiang. Αναφέρει ακόμη ότι η παρουσία του κ. Liang στη συγκέντρωση καταδεικνύει ότι η επιτυχία της DeepSeek είναι σημαντική για την πολιτική του Πεκίνου να επιτύχει αυτάρκεια σε στρατηγικές βιομηχανίες όπως η τεχνητή νοημοσύνη.
Γιατί αντέδρασε το Χρηματιστήριο στις ΗΠΑ;
Οι ανησυχίες ότι η εμφάνιση της DeepSeek, θα απειλούσε την κυριαρχία των ηγετών της τεχνητής νοημοσύνης όπως η Nvidia, οδήγησε σε μεγάλη πτώση των μετοχών τεχνολογίας στη Wall Street στις 27 Ιανουαρίου.
Οι αμερικανικές μετοχές γνώρισαν μια ιστορική πτώση την Δευτέρα 27 Ιανουαρίου καθώς οι μετοχές της Nvidia υποχώρησαν σχεδόν 17% εξαλείφοντας ένα ρεκόρ κεφαλαιοποίησης σε μια μέρα, σχεδόν 600 δις. δολαρίων.
Σύμφωνα με τον κ. Δικαιάκο, «αυτό που προκάλεσε τόσο ενδιαφέρον και είχε και τρομερές επιπτώσεις στις μετοχές των εταιρειών υψηλής τεχνολογίας είναι το γεγονός ότι η με βάση τις ανακοινώσεις αυτής της εταιρείας, το κόστος προετοιμασίας αυτού του μοντέλου ήταν πολύ μικρότερο του κόστους δημιουργίας και εκμάθησης των μοντέλων της αμερικανικής Open AI τα οποία θεωρούνται τα καλύτερα στη βιομηχανία μέχρι τώρα».
Αυτό, πρόσθεσε, δημιούργησε μία ανησυχία γιατί στις ΗΠΑ έχουν δρομολογηθεί πάρα πολύ μεγάλες επενδύσεις για την δημιουργία νέων κέντρων δεδομένων και την αγορά επεξεργαστών πολύ ψηλών επιδόσεων που παράγονται από την εταιρεία Nvidia με στόχο να γίνει ανάπτυξη μεγαλύτερων γλωσσικών μοντέλων και νέων εφαρμογών τεχνητής νοημοσύνης.
Από ό,τι φαίνεται, πρόσθεσε ο κ. Δικαιάκος, αυτές οι πολύ μεγάλες επενδύσεις που έχουν δρομολογηθεί, έχουν δρομολογηθεί με βάση τα τεχνικά χαρακτηριστικά και τις εκτιμήσεις του κόστους δημιουργίας επένδυσης των μεγάλων μοντέλων με βάση τις τεχνικές της Open AI.
«Ηρθε λοιπόν αυτή η εταιρεία από την Κίνα και ανακοίνωσε ότι μπορεί να κάνει την ίδια δουλειά με τα ίδια, ίσως και καλύτερα αποτελέσματα, τουλάχιστον αυτά έχουν δημοσιεύσει, με πολύ χαμηλότερο κόστος, δηλαδή πολύ πιο αποδοτικά και επίσης δίνει και τη δυνατότητα να μπορεί κάποιος να φορτώσει αυτό το γλωσσικό μοντέλο στο υπολογιστή του και να το χρησιμοποιήσει χωρίς κόστος, δωρεάν. Οπότε υπάρχει μία ανοικτότητα, δηλαδή ένα μέρος αυτής της δουλειάς που έχει κάνει η DeepSeek το δίνει ανοιχτά σε όλο τον κόσμο”.
Αναφέρθηκε και στις επενδύσεις που ανακοινώθηκαν από τον Πρόεδρο των ΗΠΑ Ντόναλντ Τραμπ κατά τη δεύτερη μέρα από την ανάληψη των καθηκόντων του για τα μεγάλα κέντρα δεδομένων και είπε ότι η νέα αυτή εξέλιξη με την DeepSeek θέτει εν αμφιβόλω αν πραγματικά αυτές οι μεγάλες επενδύσεις θα μπορέσουν να φέρουν εκείνες τις αποδόσεις και να παράξουν εκείνα τα έσοδα που να τις καθιστούν βιώσιμες και κερδοφόρες.
Σημείωσε ακόμη ότι η DeepSeek δεν εμφανίστηκε χθες, είναι μεν σχετικά νέα εταιρεία αλλά είχε αρχίσει να δημοσιεύει πορίσματα της ερευνητικής της προόδου εδώ και κάποιο καιρό.
Εξήγησε ότι αυτό που άλλαξε είναι το γεγονός ότι ανακοίνωσαν ότι πέτυχαν ένα μοντέλο που έχει συγκρίσιμη ή και καλύτερη επίδοση από το καλύτερο μοντέλο που υπάρχει αυτή τη στιγμή, που είναι της Open AI, και δημοσίευσαν στο διαδίκτυο δωρεάν εφαρμογή κινητού και υπηρεσία πρόσβασης στο μοντέλο για πειραματισμό.
Οι Κινέζοι, είπε, κατάφεραν να το φτιάξουν αυτό με πολύ χαμηλότερο κόστος από τις εκτιμώμενες δαπάνες που κάνει η OpenAI για την εκπαίδευση και χρήση των μοντέλων της.
«Δεν ξέρουμε ακριβώς αν είναι το ένα εκατοστό ή το ένα χιλιοστό του κόστους, και ο λόγος που δεν το ξέρουμε είναι διότι δεν γνωρίζουμε ακριβώς πόσο έχει κοστίσει συνολικά η εκπαίδευση και η δημιουργία του μοντέλου της Open AI και επίσης οι ισχυρισμοί που κάνει η DeepSeek ενδεχομένως να μην αναφέρονται σε όλα τα έξοδα και σε όλες τις προσπάθειες που έγιναν».
Τί σημαίνει κόστος εκπαίδευσης μοντέλου, ρωτήθηκε ο κ. Δικαιάκος.
«Κόστος εκπαίδευσης ενός μοντέλου σημαίνει το κόστος που πληρώνει κανείς για να κάνει τις επενδύσεις αγοράς υπολογιστών και επεξεργαστών και το κόστος της ενέργειας που χρειάζεται για να λειτουργούν αυτοί οι επεξεργαστές που είναι πάρα πολλοί και πρέπει να δουλεύουν για αρκετό καιρό, για την επεξεργασία των δεδομένων που τροφοδοτούνται στο μοντέλο ώστε αυτό να μπορεί να “παράγει” περιεχόμενο ικανοποιητικής ποιότητας ανταποκρινόμενο στις ερωτήσεις των χρηστών. Το κόστος είναι ένα σημαντικός παράγοντας που θα καθορίσει τον βαθμό και την ταχύτητα υιοθέτησης των μεγάλων γλωσσικών μοντέλων σε διαφόρους τομείς οικονομικής δραστηριότητας».
Δεν απέδωσαν οι αμερικανικές απαγορεύσεις εξαγωγών προς την Κίνα
Ο κ. Δικαιάκος εξήγησε ότι η Open AI και οι αμερικανικές εταιρείες βασίζονται σε επεξεργαστές πολύ υψηλής τεχνολογίας και επίδοσης που σχεδιάζονται από την Nvidia και κατασκευάζονται από την TSMC στην Ταϊβάν και για τους οποίους επεξεργαστές οι ΗΠΑ έχουν επιβάλλει περιορισμούς εξαγωγών προς την Κίνα αλλά πολύ πρόσφατα και σε αρκετές χώρες ευρωπαϊκές. Στην Κίνα, είπε, υπάρχει απαγόρευση εξαγωγών των πιο προηγμένων μοντέλων, ενώ σε αρκετές ευρωπαϊκές χώρες υπάρχουν περιορισμοί στις εξαγωγές.
Ο λόγος, πρόσθεσε, που επιβλήθηκαν αυτοί οι περιορισμοί ήταν ακριβώς διότι ΗΠΑ δεν ήθελαν να χάσουν την μάχη στην τεχνητή νοημοσύνη διότι υπήρχε η υπόθεση εργασίας ότι η ανάπτυξη των νέων γλωσσικών μοντέλων δηλαδή μετά το Chat GPT 4, 5, και η προσέγγιση σε αυτό που λέγεται γενικευμένη τεχνητή νοημοσύνη ή υπέρ-νοημοσύνη είναι κάτι που θα γίνει μέσα από πολύ μεγάλα υπολογιστικά κέντρα που έχουν πολύ δυνατούς επεξεργαστές τους οποίους τους σχεδιάζει μόνο η Nvidia αυτή τη στιγμή.
«Αρα θεωρούσαν ότι θα καθυστερούσαν την Κίνα και δεν ήταν τόσο ξεκάθαρο στη διεθνή αγορά ποιες ακριβώς ήταν οι δυνατότητες της Κίνας δηλαδή υπήρχε η εντύπωση ότι η Κίνα είναι πιο πίσω και ότι θα την καθυστερήσουμε βάζοντας αυτούς τους περιορισμούς.
Τότε, είπε, ήρθαν οι ανακοινώσεις της DeepSeek να θέσουν εν αμφιβόλω αυτή την υπόθεση εργασίας και επειδή υπήρχε μία πολύ μεγάλη προσδοκία για το τι θα μπορούσε να επιτευχθεί με αυτές τις τεράστιες επενδύσεις που είχαν προγραμματιστεί και ανακοινώθηκαν από τον Τραμπ και μεγάλες εταιρείες όπως η Meta, οι μεγάλες προσδοκίες μπορούμε να πούμε ότι προσγειώθηκαν.
«Δημιουργήθηκε μια φούσκα που διορθώθηκε»
Ο κ. Δικαιάκος εξέφρασε την άποψη ότι είχε δημιουργηθεί μια φούσκα στο χρηματιστήριο που τώρα φαίνεται να διορθώθηκε.
«Είχε δημιουργηθεί μία φούσκα θεωρώ. Η μετοχή της Nvidia είχε πάει στον ουρανό και έγινε μία διόρθωση δηλαδή ήρθαμε πιο κοντά στην πραγματικότητα», τόνισε ο κ. Δικαιάκος.
Ερωτηθείς εάν η Κίνα έπιασε τους Αμερικανούς στον ύπνο, είπε «μπορούμε να το πούμε και αυτό διότι και η εταιρεία Alibaba ανακοίνωσε μόλις χθες ότι έχει ένα γλωσσικό μοντέλο που είναι μάλιστα και καλύτερο από το DeepSeek».
Εκτίμησε ότι η πρόοδος στην Κίνα ήταν αναμενόμενη.
«Ηταν λίγο ή πολύ αναμενόμενο δηλαδή δεν μπορεί κανείς να βάλει εύκολα εμπόδια στην διακίνηση της επιστημονικής γνώσης αφενός και αφετέρου είναι γνωστό ότι η Κίνα έχει κάνει αλματώδη επιστημονική πρόοδο, αυτό είναι προφανές από τις επιστημονικές δημοσιεύσεις στα κορυφαία επιστημονικά περιοδικά και συνεδρία τεχνητής νοημοσύνης άρα έχουν πολύ καλό επιστημονικό δυναμικό και επιπλέον έχουν πάρα πολύ καλό δυναμικό μηχανικών λογισμικού και τεχνητής νοημοσύνης».
Καταλήγοντας είπε ότι « και όπως είπε ένας γνωστός Κινέζος συγγραφέας και επιστήμονας, ο Κai-Fu Lee, οι Αμερικάνοι μπορεί να είναι πιο μπροστά στο να έρχονται με τις καλύτερες ερευνητικές ιδέες οι Κινέζοι όμως είναι πιο μπροστά στο να τις υλοποιούν και να τις φέρνουν στην αγορά με πιο αποδοτικό και φθηνό τρόπο».