Η DeepSeek καθυστερεί την κυκλοφορία του νέου μοντέλου R2 λόγω τεχνικών προβλημάτων με τα τσιπ της Huawei. Η κινεζική εταιρεία τεχνητής νοημοσύνης DeepSeek καθυστέρησε την κυκλοφορία του νέου της μοντέλου, R2, καθώς δεν μπόρεσε να το εκπαιδεύσει με επιτυχία χρησιμοποιώντας τα τσιπ της Huawei. Αυτή η εξέλιξη αναδεικνύει τα όρια των προσπαθειών του Πεκίνου να αντικαταστήσει την αμερικανική τεχνολογία, τονίζοντας τις προκλήσεις που αντιμετωπίζουν οι κινεζικές εταιρείες στον τομέα της τεχνολογίας.
Σύμφωνα με πηγές που επικαλούνται οι Financial Times, η DeepSeek ενθαρρύνθηκε από τις αρχές να υιοθετήσει τον επεξεργαστή Ascend της Huawei αντί για τα συστήματα της Nvidia. Ωστόσο, οι ίδιες πηγές αναφέρουν ότι η DeepSeek αντιμετώπισε σοβαρά τεχνικά προβλήματα κατά τη διάρκεια της διαδικασίας εκπαίδευσης του μοντέλου R2, γεγονός που την οδήγησε στη χρήση τσιπ Nvidia για την εκπαίδευση, διατηρώντας ωστόσο τα τσιπ της Huawei για τα συμπεράσματα.
Τα προβλήματα αυτά ήταν η κύρια αιτία καθυστέρησης της κυκλοφορίας του μοντέλου από τον Μάιο, με αποτέλεσμα η DeepSeek να χάσει έδαφος από τους ανταγωνιστές της. Η διαδικασία εκπαίδευσης περιλαμβάνει την εκμάθηση του μοντέλου από ένα μεγάλο σύνολο δεδομένων, ενώ η συμπερασματολογία αφορά τη χρήση του εκπαιδευμένου μοντέλου για τη διατύπωση προβλέψεων ή την απάντηση σε ερωτήσεις, όπως αυτές που παρέχει ένα chatbot.
Τα προβλήματα του DeepSeek καταδεικνύουν τις αδυναμίες των κινεζικών τσιπ σε σχέση με τους αμερικανικούς ανταγωνιστές, γεγονός που αναδεικνύει τις προκλήσεις για την τεχνολογική αυτάρκεια της Κίνας. Οι Financial Times ανέφεραν ότι το Πεκίνο ζητά από τις κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για το H20 της Nvidia, επισημαίνοντας την ανάγκη προώθησης εναλλακτικών λύσεων από τις Huawei και Cambricon.
Η Huawei έστειλε μηχανικούς στα γραφεία της DeepSeek για να υποστηρίξει τη διαδικασία ανάπτυξης του μοντέλου R2, αλλά, παρά τις προσπάθειες, η εταιρεία δεν κατάφερε να πετύχει μια επιτυχημένη εκπαιδευτική δοκιμή στο τσιπ Ascend. Παράλληλα, η DeepSeek συνεχίζει να συνεργάζεται με την Huawei για την επίλυση των προβλημάτων και την προσαρμογή του μοντέλου στις απαιτήσεις των τσιπ Ascend.
Ο ιδρυτής Liang Wenfeng φέρεται να έχει εκφράσει εσωτερικά τη δυσαρέσκειά του για την πρόοδο της R2, επισημαίνοντας την ανάγκη περισσότερου χρόνου για την ανάπτυξη ενός προηγμένου μοντέλου που θα διασφαλίσει το προβάδισμα της εταιρείας στον τομέα της τεχνητής νοημοσύνης. Η κυκλοφορία του R2 καθυστέρησε, επίσης, λόγω της αναμενόμενης ημερομηνίας δημοσίευσης δεδομένων για το ανανεωμένο μοντέλο, με φήμες να υποδηλώνουν ότι μπορεί να κυκλοφορήσει τις επόμενες εβδομάδες.
Τέλος, όπως επισημαίνει ο Ritwik Gupta, ερευνητής τεχνητής νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϊ, τα μοντέλα αυτά είναι προϊόντα που μπορούν εύκολα να αντικατασταθούν, καθιστώντας τη διαδικασία ανάπτυξής τους ιδιαίτερα κρίσιμη.
Πηγή περιεχομένου: in.gr