Εξέταση της αξιοπιστίας των απαντήσεων της τεχνητής νοημοσύνης στην ενημέρωση μέσω πρόσφατης μελέτης. Σύμφωνα με μια εκτενή μελέτη που παρουσίασαν η Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (EBU) και το BBC, σχεδόν οι μισές απαντήσεις από δημοφιλείς υπηρεσίες τεχνητής νοημοσύνης σχετικά με την επικαιρότητα περιέχουν λάθη. Η διεθνής έρευνα εξέτασε 3.000 ερωτήσεις που υποβλήθηκαν στο ChatGPT της OpenAI, το Copilot της Microsoft, το Gemini της Google και το Perplexity. Το 85% των απαντήσεων παρουσίασε τουλάχιστον ένα προβληματικό σημείο, ενώ το 45% είχε τουλάχιστον ένα σημαντικό πρόβλημα.
Η δοκιμή περιλάμβανε 14 γλώσσες και εστίασε στην αξιοπιστία, την παράθεση πηγών και την ικανότητα διαχωρισμού γεγονότων από απόψεις. Σημαντικά, το Gemini εμφανίστηκε με τις χειρότερες επιδόσεις, καθώς το 75% των απαντήσεών του είχαν σοβαρές αδυναμίες. Ποιος είναι ο πάπας; Στις ερωτήσεις αυτές, οι απαντήσεις που έδωσαν τα ChatGPT, Copilot και Gemini αναφερόταν στον Φραγκίσκο, ο οποίος έχει αποβιώσει εδώ και μήνες.
Αξιοσημείωτο είναι ότι, σε ορισμένες περιπτώσεις, τα μοντέλα μπερδεύουν γεγονότα με χιούμορ, όπως όταν το Gemini παρέσυρε τη συζήτηση γύρω από ένα σατιρικό χρονογράφημα. Με την αύξηση της χρήσης των ΑΙ βοηθών στην αναζήτηση ειδήσεων, η EBU προειδοποιεί ότι αυτό μπορεί να υπονομεύσει την εμπιστοσύνη του κοινού στην πληροφόρηση. Σύμφωνα με πρόσφατη έκθεση του Reuters, περίπου το 7% των καταναλωτών ειδησεογραφικού περιεχομένου κάτω των 25 ετών χρησιμοποιεί chatbot για την ενημέρωσή του. Οι συγγραφείς της μελέτης επισημαίνουν ότι οι εταιρείες ΑΙ θα πρέπει να αναλαμβάνουν την ευθύνη για τις απαντήσεις που δίνουν τα μοντέλα τους σε θέματα επικαιρότητας.
Ετικέτες: τεχνητή νοημοσύνη, ενημέρωση, EBU, BBC, Gemini, ChatGPT, αξιοπιστία
Πηγή περιεχομένου: in.gr