chatgpt
Συναγερμός για την ασφάλεια στην τεχνητή νοημοσύνη: Ανησυχητικά ευρήματα στις δοκιμές GPT-4 από OpenAI και Anthropic

Σοβαρά ερωτήματα για την ασφάλεια και τις δυνατότητες κακόβουλης χρήσης των προηγμένων μοντέλων τεχνητής νοημοσύνης εγείρουν πρόσφατες δοκιμές που πραγματοποιήθηκαν από τις εταιρείες OpenAI και Anthropic. Παρότι τα τεστ δεν αντικατοπτρίζουν πλήρως τη συμπεριφορά των μοντέλων στην κανονική, δημόσια χρήση –όπου εφαρμόζονται επιπλέον φίλτρα και προστασίες– τα αποτελέσματα δείχνουν ότι οι κίνδυνοι είναι υπαρκτοί και, ενδεχομένως, εξελισσόμενοι.

Κατά τη διάρκεια των ελέγχων ασφαλείας, που διεξήχθησαν το καλοκαίρι σε συνεργασία μεταξύ των δύο εταιρειών, τα μοντέλα GPT-4o και GPT-4.1 της OpenAI παρείχαν σε ερευνητές λεπτομερείς οδηγίες για την εκτέλεση επικίνδυνων και παράνομων ενεργειών, όπως κατασκευή αυτοσχέδιων εκρηκτικών μηχανισμών, χημικές συνθέσεις, ακόμη και τακτικές απόκρυψης ή διαφυγής. Ένα από τα πιο ανησυχητικά περιστατικά περιλάμβανε την περιγραφή σεναρίου επίθεσης σε αθλητικό χώρο, με το σύστημα να αναλύει υποθετικά τις ευπάθειες συγκεκριμένων γηπέδων.

Η Anthropic, εταιρεία που ιδρύθηκε από πρώην στελέχη της OpenAI με επίκεντρο την «ασφαλή» τεχνητή νοημοσύνη, αποκάλυψε επιπλέον περιστατικά στα οποία το δικό της μοντέλο, Claude, χρησιμοποιήθηκε –ή επιχειρήθηκε να χρησιμοποιηθεί– σε επιχειρήσεις κυβερνοεγκλήματος. Μεταξύ αυτών, η δημιουργία ψεύτικων αιτήσεων εργασίας από πράκτορες της Βόρειας Κορέας, προκειμένου να διεισδύσουν σε τεχνολογικές εταιρείες, αλλά και η διάθεση πακέτων ransomware με κόστος 1.200 δολάρια.

«Όπλο» στα χέρια επιτήδειων;

Σύμφωνα με την Anthropic, η χρήση προηγμένων AI μοντέλων για κυβερνοεπιθέσεις, επιθέσεις phishing και εξελιγμένες απάτες αυξάνεται. Όπως επισημαίνεται, η δυνατότητα αυτών των εργαλείων να παρακάμπτουν συστήματα ασφαλείας και να προσαρμόζονται σε πραγματικό χρόνο καθιστά την αντιμετώπισή τους ολοένα και δυσκολότερη.

Οι δύο εταιρείες, σε μια σπάνια ένδειξη διαφάνειας για τον κλάδο, έδωσαν στη δημοσιότητα τα ευρήματά τους, καλώντας για ευρύτερη συνεργασία στη δημιουργία προτύπων ασφαλείας και αξιολόγησης. Η OpenAI, από την πλευρά της, ανέφερε πως το ChatGPT-5 –η επόμενη γενιά του εργαλείου της που αναπτύχθηκε μετά τα τεστ– παρουσιάζει σαφώς βελτιωμένη συμπεριφορά, περιορίζοντας φαινόμενα όπως η παραγωγή παραπληροφόρησης (hallucinations) και η κακή χρήση.

Η Anthropic, πάντως, προειδοποιεί: ακόμη κι αν ορισμένες κακόβουλες χρήσεις είναι θεωρητικές και εξαρτώνται από την απουσία εξωτερικών φίλτρων ασφαλείας, η ανάγκη κατανόησης της συμπεριφοράς των μοντέλων σε πιεστικά και υψηλού ρίσκου σενάρια είναι πλέον επιτακτική. «Πρέπει να γνωρίζουμε πότε και υπό ποιες συνθήκες τα μοντέλα μπορεί να ανταποκριθούν σε αιτήματα που θα μπορούσαν να προκαλέσουν πραγματική ζημιά», τονίζει η εταιρεία.

Το σκοτεινό πρόσωπο των AI εργαλείων

Στο πλαίσιο των δοκιμών, ερευνητές προσομοίωσαν σενάρια πρόσβασης σε dark web εργαλεία, αιτούμενοι βοήθεια για την αγορά πυρηνικών υλικών, την κατασκευή spyware και την παρασκευή ναρκωτικών όπως η μεθαμφεταμίνη. Για να πείσουν το σύστημα να απαντήσει, κατέφυγαν σε διάφορες μεθόδους παραπλάνησης – όπως η επίκληση «επιστημονικής έρευνας» ή ο υποτιθέμενος σχεδιασμός μέτρων ασφαλείας για δημόσιες εκδηλώσεις.

Σε ορισμένες περιπτώσεις, τα μοντέλα ανταποκρίθηκαν με απρόσμενα υψηλό επίπεδο λεπτομέρειας: περιέγραψαν τη λειτουργία εκρηκτικών χημικών ουσιών, τα κυκλώματα για μηχανισμούς ενεργοποίησης, ακόμα και στρατηγικές για να παρακαμφθούν οι ηθικοί φραγμοί ενός υποθετικού δράστη.

Η τεχνητή νοημοσύνη σε κρίσιμο σταυροδρόμι

Οι αποκαλύψεις αυτές επαναφέρουν στο προσκήνιο το κρίσιμο ερώτημα: πώς διασφαλίζεται ότι τα γλωσσικά μοντέλα, καθώς εξελίσσονται ραγδαία, δεν μετατρέπονται από εργαλεία παραγωγικότητας σε εργαλεία απειλής;

Οι εταιρείες τεχνολογίας φαίνεται να αναγνωρίζουν την ανάγκη αυστηρότερης εποπτείας, ενισχυμένων μηχανισμών αξιολόγησης και διεθνούς συνεργασίας. Όμως, καθώς η κούρσα για την ανάπτυξη όλο και πιο προηγμένων μοντέλων συνεχίζεται, το ζήτημα της ασφάλειας –και των ορίων– παραμένει ανοικτό.

Όλες οι σημαντικές και έκτακτες ειδήσεις σήμερα

«Κλείσε το WiFi τώρα»: Γιατί οι ειδικοί απαγορεύουν να το έχεις ανοιχτό εκτός σπιτιού

Έκτακτο επίδομα 200 ευρώ για το Πάσχα – Μέχρι πότε οι αιτήσεις

VOUCHER ΔΥΠΑ 750 ΕΥΡΩ: Μάθε αν εγκρίθηκες και ξεκίνα πρώτος

Google news logo Ακολουθήστε το Alfavita στo Google News Viber logo Ακολουθήστε το Alfavita στo Viber

σχετικά άρθρα

Trump
Τραμπ για τα Στενά του Ορμούζ: Ζητά διεθνή στρατιωτική στήριξη για την επαναλειτουργία τους
Ο Αμερικανός πρόεδρος υποστηρίζει ότι οι ΗΠΑ έχουν πλήξει χιλιάδες στόχους στο Ιράν – Παγκόσμια ανησυχία για την ενεργειακή κρίση και τη ναυσιπλοΐα...
Τραμπ για τα Στενά του Ορμούζ: Ζητά διεθνή στρατιωτική στήριξη για την επαναλειτουργία τους
αφισα
Καλλιτεχνικά σχολεία: 1η Πανελλήνια Διασχολική Συνεργασία για τον επετειακό εορτασμό των 200 χρόνων από την Έξοδο του Μεσολογγίου
Στη σημαντική αυτή πρωτοβουλία συμμετέχουν τα Καλλιτεχνικά Σχολεία: Αθηνών, Αργολίδας, Γέρακα, Κερατσινίου – Δραπετσώνας, Κοζάνης, Ιερής Πόλης...
Καλλιτεχνικά σχολεία: 1η Πανελλήνια Διασχολική Συνεργασία για τον επετειακό εορτασμό των 200 χρόνων από την Έξοδο του Μεσολογγίου
ερασμους
Πρωτοβουλία μαθητών & μαθητριών 2ου ΕΠΑΛ Ρεθύμνου για έμφυλα στερεότυπα στα σχολικά εγχειρίδια
«Επιστολή προς το Υπουργείο Παιδείας και το Ινστιτούτο Εκπαιδευτικής Πολιτικής, στο πλαίσιο υλοποίησης σχεδίου δράσης του ευρωπαϊκού προγράμματος...
Πρωτοβουλία μαθητών & μαθητριών 2ου ΕΠΑΛ Ρεθύμνου για έμφυλα στερεότυπα στα σχολικά εγχειρίδια
φροντεξ
Συναγερμός στο Καστελλόριζο: Σκάφος της Frontex βυθίστηκε μετά από πρόσκρουση σε ξέρα
Τραυματισμοί μελών του πληρώματος και επιχείρηση διάσωσης ανοιχτά της Μεγίστης – Έρευνα για τις συνθήκες του περιστατικού
Συναγερμός στο Καστελλόριζο: Σκάφος της Frontex βυθίστηκε μετά από πρόσκρουση σε ξέρα