chatgpt
Συναγερμός για την ασφάλεια στην τεχνητή νοημοσύνη: Ανησυχητικά ευρήματα στις δοκιμές GPT-4 από OpenAI και Anthropic

Σοβαρά ερωτήματα για την ασφάλεια και τις δυνατότητες κακόβουλης χρήσης των προηγμένων μοντέλων τεχνητής νοημοσύνης εγείρουν πρόσφατες δοκιμές που πραγματοποιήθηκαν από τις εταιρείες OpenAI και Anthropic. Παρότι τα τεστ δεν αντικατοπτρίζουν πλήρως τη συμπεριφορά των μοντέλων στην κανονική, δημόσια χρήση –όπου εφαρμόζονται επιπλέον φίλτρα και προστασίες– τα αποτελέσματα δείχνουν ότι οι κίνδυνοι είναι υπαρκτοί και, ενδεχομένως, εξελισσόμενοι.

Κατά τη διάρκεια των ελέγχων ασφαλείας, που διεξήχθησαν το καλοκαίρι σε συνεργασία μεταξύ των δύο εταιρειών, τα μοντέλα GPT-4o και GPT-4.1 της OpenAI παρείχαν σε ερευνητές λεπτομερείς οδηγίες για την εκτέλεση επικίνδυνων και παράνομων ενεργειών, όπως κατασκευή αυτοσχέδιων εκρηκτικών μηχανισμών, χημικές συνθέσεις, ακόμη και τακτικές απόκρυψης ή διαφυγής. Ένα από τα πιο ανησυχητικά περιστατικά περιλάμβανε την περιγραφή σεναρίου επίθεσης σε αθλητικό χώρο, με το σύστημα να αναλύει υποθετικά τις ευπάθειες συγκεκριμένων γηπέδων.

Η Anthropic, εταιρεία που ιδρύθηκε από πρώην στελέχη της OpenAI με επίκεντρο την «ασφαλή» τεχνητή νοημοσύνη, αποκάλυψε επιπλέον περιστατικά στα οποία το δικό της μοντέλο, Claude, χρησιμοποιήθηκε –ή επιχειρήθηκε να χρησιμοποιηθεί– σε επιχειρήσεις κυβερνοεγκλήματος. Μεταξύ αυτών, η δημιουργία ψεύτικων αιτήσεων εργασίας από πράκτορες της Βόρειας Κορέας, προκειμένου να διεισδύσουν σε τεχνολογικές εταιρείες, αλλά και η διάθεση πακέτων ransomware με κόστος 1.200 δολάρια.

«Όπλο» στα χέρια επιτήδειων;

Σύμφωνα με την Anthropic, η χρήση προηγμένων AI μοντέλων για κυβερνοεπιθέσεις, επιθέσεις phishing και εξελιγμένες απάτες αυξάνεται. Όπως επισημαίνεται, η δυνατότητα αυτών των εργαλείων να παρακάμπτουν συστήματα ασφαλείας και να προσαρμόζονται σε πραγματικό χρόνο καθιστά την αντιμετώπισή τους ολοένα και δυσκολότερη.

Οι δύο εταιρείες, σε μια σπάνια ένδειξη διαφάνειας για τον κλάδο, έδωσαν στη δημοσιότητα τα ευρήματά τους, καλώντας για ευρύτερη συνεργασία στη δημιουργία προτύπων ασφαλείας και αξιολόγησης. Η OpenAI, από την πλευρά της, ανέφερε πως το ChatGPT-5 –η επόμενη γενιά του εργαλείου της που αναπτύχθηκε μετά τα τεστ– παρουσιάζει σαφώς βελτιωμένη συμπεριφορά, περιορίζοντας φαινόμενα όπως η παραγωγή παραπληροφόρησης (hallucinations) και η κακή χρήση.

Η Anthropic, πάντως, προειδοποιεί: ακόμη κι αν ορισμένες κακόβουλες χρήσεις είναι θεωρητικές και εξαρτώνται από την απουσία εξωτερικών φίλτρων ασφαλείας, η ανάγκη κατανόησης της συμπεριφοράς των μοντέλων σε πιεστικά και υψηλού ρίσκου σενάρια είναι πλέον επιτακτική. «Πρέπει να γνωρίζουμε πότε και υπό ποιες συνθήκες τα μοντέλα μπορεί να ανταποκριθούν σε αιτήματα που θα μπορούσαν να προκαλέσουν πραγματική ζημιά», τονίζει η εταιρεία.

Το σκοτεινό πρόσωπο των AI εργαλείων

Στο πλαίσιο των δοκιμών, ερευνητές προσομοίωσαν σενάρια πρόσβασης σε dark web εργαλεία, αιτούμενοι βοήθεια για την αγορά πυρηνικών υλικών, την κατασκευή spyware και την παρασκευή ναρκωτικών όπως η μεθαμφεταμίνη. Για να πείσουν το σύστημα να απαντήσει, κατέφυγαν σε διάφορες μεθόδους παραπλάνησης – όπως η επίκληση «επιστημονικής έρευνας» ή ο υποτιθέμενος σχεδιασμός μέτρων ασφαλείας για δημόσιες εκδηλώσεις.

Σε ορισμένες περιπτώσεις, τα μοντέλα ανταποκρίθηκαν με απρόσμενα υψηλό επίπεδο λεπτομέρειας: περιέγραψαν τη λειτουργία εκρηκτικών χημικών ουσιών, τα κυκλώματα για μηχανισμούς ενεργοποίησης, ακόμα και στρατηγικές για να παρακαμφθούν οι ηθικοί φραγμοί ενός υποθετικού δράστη.

Η τεχνητή νοημοσύνη σε κρίσιμο σταυροδρόμι

Οι αποκαλύψεις αυτές επαναφέρουν στο προσκήνιο το κρίσιμο ερώτημα: πώς διασφαλίζεται ότι τα γλωσσικά μοντέλα, καθώς εξελίσσονται ραγδαία, δεν μετατρέπονται από εργαλεία παραγωγικότητας σε εργαλεία απειλής;

Οι εταιρείες τεχνολογίας φαίνεται να αναγνωρίζουν την ανάγκη αυστηρότερης εποπτείας, ενισχυμένων μηχανισμών αξιολόγησης και διεθνούς συνεργασίας. Όμως, καθώς η κούρσα για την ανάπτυξη όλο και πιο προηγμένων μοντέλων συνεχίζεται, το ζήτημα της ασφάλειας –και των ορίων– παραμένει ανοικτό.

Όλες οι σημαντικές και έκτακτες ειδήσεις σήμερα

Νέο Προσκλητήριο Προσλήψεων Εκπαιδευτών Ενηλίκων: Αφορά όλα τα πτυχία ΑΕΙ-ΤΕΙ - Πιστοποιηθείτε άμεσα

ΕΥΚΟΛΕΣ πιστοποιήσεις ΙΣΠΑΝΙΚΩΝ - ΙΤΑΛΙΚΩΝ για ΑΣΕΠ για Εκπαιδευτικούς - Πάρτε τις ΑΜΕΣΑ μόρια 2ης ξένης γλώσσας

Παν.Πατρών: Tο 1ο στην Ελλάδα Πανεπιστημιακό Πιστοποιητικό ΤΕΧΝΗΤΗΣ ΝΟΗΜΟΣΥΝΗΣ για εκπαιδευτικούς

Πανεπιστήμιο Αιγαίου: Το κορυφαίο πρόγραμμα ειδικής αγωγής στην Ελλάδα - Αιτήσεις έως 29/8

Μοριοδοτούμενο σεμινάριο Ειδικής Αγωγής Πανεπιστημίου Πατρών με μόνο 60 ευρώ 

Google news logo Ακολουθήστε το Alfavita στo Google News Viber logo Ακολουθήστε το Alfavita στo Viber

σχετικά άρθρα

panepistimio amfitheatro
Παπαθανάσης: Στο ΕΣΠΑ η απόκτηση ακαδημαϊκής διδακτικής εμπειρίας για 1300 διδάκτορες σε 24 ΑΕΙ της χώρας
Νέα ευκαιρία για ακαδημαϊκή διδακτική εμπειρία σε 24 ΑΕΙ το 2025-2026
Παπαθανάσης: Στο ΕΣΠΑ η απόκτηση ακαδημαϊκής διδακτικής εμπειρίας για 1300 διδάκτορες σε 24 ΑΕΙ της χώρας
χρήματα
Επίδομα 100 ευρώ - Επίσημο: Τη Δευτέρα 1 Σεπτεμβρίου η πληρωμή για 80.000 εργαζόμενους
Αποκάλυψη Δόμνας Μιχαηλίδου: Τη Δευτέρα 1/9 μπαίνει στους λογαριασμούς των 80.000 δικαιούχων το επίδομα 100 ευρώ - Πώς θα γίνουν οι πληρωμές
Επίδομα 100 ευρώ - Επίσημο: Τη Δευτέρα 1 Σεπτεμβρίου η πληρωμή για 80.000 εργαζόμενους