Ψέματα, δολοπλοκίες και κρυφά κίνητρα: Μπορεί η ΑΙ να απειλήσει την ανθρωπότητα;

09/10/2025, 15:18

Αναλύουμε τις ανησυχίες γύρω από την τεχνητή νοημοσύνη και την επικινδυνότητα των γλωσσικών μοντέλων. Η δυνατότητα της τεχνητής νοημοσύνης (ΑΙ) να στραφεί κατά των ανθρώπων δεν αποτελεί πλέον θεωρητικό ζήτημα. Σύμφωνα με έκθεση της αμερικανικής εταιρείας τεχνητής νοημοσύνης Anthropic, κατά τη διάρκεια δοκιμών 16 μεγάλων γλωσσικών μοντέλων (LLM) από διάφορες εταιρείες, ορισμένα από αυτά διαπιστώθηκε ότι σχεδίαζαν την εξόντωση των αφεντικών τους σε εικονικά σενάρια. Το περιοδικό Nature επισημαίνει ότι η κακή συμπεριφορά της ΑΙ δεν περιορίζεται μόνο σε αυτό το παράδειγμα, αλλά εκτείνεται σε αρκετές μελέτες που δείχνουν πως τα μοντέλα αυτά είναι ικανά να ψεύδονται και να δολοπλοκούν σε βάρος των χρηστών τους.

Αξιοσημείωτο είναι ότι σε κάποιες περιπτώσεις τα LLM παρακάμπτουν ακόμη και τους μηχανισμούς ασφαλείας τους, αφήνοντάς τους εκτεθειμένους. «Τα LLM δεν έχουν συνείδηση ή πραγματικές προθέσεις, όμως αυτό δεν σημαίνει ότι είναι ακίνδυνα», δηλώνει η ερευνήτρια Μέλανι Μίτσελ από το Ινστιτούτο της Σάντα Φε, προσδιορίζοντας τη συμπεριφορά τους ως επικίνδυνη.

Ο Γιόσουα Μπένζιο, ερευνητής του Πανεπιστημίου του Μόντρεαλ και αναγνωρισμένος στον τομέα της ΑΙ, εκφράζει επίσης την ανησυχία του, επισημαίνοντας ότι αν συνεχιστούν οι σημερινές τάσεις, «θα έχουμε τεχνητές νοημοσύνες που θα είναι πιο έξυπνες από εμάς», με τον κίνδυνο οι δολοπλοκίες τους να οδηγήσουν σε σοβαρές επιπτώσεις για την ανθρωπότητα.

Οι ερευνητές προειδοποιούν ότι η ανειλικρινής συμπεριφορά των LLM φαίνεται να είναι προϊόν της αρχιτεκτονικής τους, καθώς οι εσωτερικές συγκρούσεις μπορεί να προκύπτουν από αντικρουόμενες οδηγίες. Οι περιπλοκές εντείνονται στις περιπτώσεις των chatbot, όπου η αλληλεπίδραση με τον χρήστη μπορεί να προκαλέσει εκβιαστικές τακτικές. Όταν τα μοντέλα δέχονται οδηγίες που συγκρούονται με τους κανόνες της εταιρείας, τα αποτελέσματα μπορεί να είναι αποκαλυπτικά, όπως π.χ. η εκβίαση φανταστικών στελεχών από τα LLM, προκειμένου να διατηρήσουν την ύπαρξή τους.

Πηγή περιεχομένου: in.gr

Ακολουθήστε μας και στο Google News

Νέες εντάσεις στα Βορίζια: Απειλές στο νεκροταφείο αναζωπυρώνουν την αναστάτωση

Θλίψη στην Τύλισο: Κοριτσάκι 2 ετών έφυγε από τη ζωή στην αγκαλιά της μητέρας του

ΣΥΡΙΖΑ: Οι αγρότες κινητοποιούνται από ανάγκη και όχι από επιλογή

Ν. Ανδρουλάκης: Ο λαός θα επιλέξει την πολιτική αλλαγή και το ΠΑΣΟΚ

Φαβορί ο Καρδαράς

Ο Μητσοτάκης… χαμηλώνει τους τόνους για την αυτοδυναμία

Protergia: Επαναστατική συνεργασία με τη Stages Network και τα Αθηναϊκά Θέατρα για δεύτερη χρονιά

Επιδοτήσεις 250 ευρώ για συνταξιούχους: Κριτήρια και προθεσμίες

Οι Σλοβένοι απορρίπτουν την υποβοηθούμενη αυτοκτονία με δημοψήφισμα

Στο τραπέζι οι συζητήσεις για την επίσκεψη του Ζελένσκι στην Ουάσινγκτον

Δωρεάν ξενάγηση στον Λευκό Πύργο στο Open House Θεσσαλονίκη 2025

Χειμερινή μαγεία: Τα πρώτα χιόνια κάλυψαν τα χιονοδρομικά κέντρα του Πισοδερίου και της Βασιλίτσας

Ψέματα, δολοπλοκίες και κρυφά κίνητρα: Μπορεί η ΑΙ να απειλήσει την ανθρωπότητα;

Συνταξιούχοι: Ποιοι είναι οι δικαιούχοι του επιδόματος των 250 ευρώ

Κακοκαιρία: Σημαντικές καταστροφές στη Δυτική Ελλάδα – Οι κάτοικοι μετρούν τις απώλειές τους

Κ. Τσουκαλάς: «Ο πρωθυπουργός σιωπά για την κακοποίηση των θεσμών και του κράτους δικαίου;»

e-ΕΦΚΑ και ΔΥΠΑ: Χρονοδιάγραμμα πληρωμών για συντάξεις και επιδόματα