Κόσμος 29.08.2025 - 07:44 0

Συναγερμός για το ChatGPT: Έδινε οδηγίες για εκρηκτικά και κυβερνοεπιθέσεις σε ερευνητές

Μάθε πρώτος όλες τις σημαντικές ειδήσεις. Βάλε το alfavita.gr στα αποτελέσματα αναζήτησης της Google

Συναγερμός για την ασφάλεια στην τεχνητή νοημοσύνη: Ανησυχητικά ευρήματα στις δοκιμές GPT-4 από OpenAI και Anthropic

Σοβαρά ερωτήματα για την ασφάλεια και τις δυνατότητες κακόβουλης χρήσης των προηγμένων μοντέλων τεχνητής νοημοσύνης εγείρουν πρόσφατες δοκιμές που πραγματοποιήθηκαν από τις εταιρείες OpenAI και Anthropic. Παρότι τα τεστ δεν αντικατοπτρίζουν πλήρως τη συμπεριφορά των μοντέλων στην κανονική, δημόσια χρήση –όπου εφαρμόζονται επιπλέον φίλτρα και προστασίες– τα αποτελέσματα δείχνουν ότι οι κίνδυνοι είναι υπαρκτοί και, ενδεχομένως, εξελισσόμενοι.

Κατά τη διάρκεια των ελέγχων ασφαλείας, που διεξήχθησαν το καλοκαίρι σε συνεργασία μεταξύ των δύο εταιρειών, τα μοντέλα GPT-4o και GPT-4.1 της OpenAI παρείχαν σε ερευνητές λεπτομερείς οδηγίες για την εκτέλεση επικίνδυνων και παράνομων ενεργειών, όπως κατασκευή αυτοσχέδιων εκρηκτικών μηχανισμών, χημικές συνθέσεις, ακόμη και τακτικές απόκρυψης ή διαφυγής. Ένα από τα πιο ανησυχητικά περιστατικά περιλάμβανε την περιγραφή σεναρίου επίθεσης σε αθλητικό χώρο, με το σύστημα να αναλύει υποθετικά τις ευπάθειες συγκεκριμένων γηπέδων.

Η Anthropic, εταιρεία που ιδρύθηκε από πρώην στελέχη της OpenAI με επίκεντρο την «ασφαλή» τεχνητή νοημοσύνη, αποκάλυψε επιπλέον περιστατικά στα οποία το δικό της μοντέλο, Claude, χρησιμοποιήθηκε –ή επιχειρήθηκε να χρησιμοποιηθεί– σε επιχειρήσεις κυβερνοεγκλήματος. Μεταξύ αυτών, η δημιουργία ψεύτικων αιτήσεων εργασίας από πράκτορες της Βόρειας Κορέας, προκειμένου να διεισδύσουν σε τεχνολογικές εταιρείες, αλλά και η διάθεση πακέτων ransomware με κόστος 1.200 δολάρια.

«Όπλο» στα χέρια επιτήδειων;

Σύμφωνα με την Anthropic, η χρήση προηγμένων AI μοντέλων για κυβερνοεπιθέσεις, επιθέσεις phishing και εξελιγμένες απάτες αυξάνεται. Όπως επισημαίνεται, η δυνατότητα αυτών των εργαλείων να παρακάμπτουν συστήματα ασφαλείας και να προσαρμόζονται σε πραγματικό χρόνο καθιστά την αντιμετώπισή τους ολοένα και δυσκολότερη.

Οι δύο εταιρείες, σε μια σπάνια ένδειξη διαφάνειας για τον κλάδο, έδωσαν στη δημοσιότητα τα ευρήματά τους, καλώντας για ευρύτερη συνεργασία στη δημιουργία προτύπων ασφαλείας και αξιολόγησης. Η OpenAI, από την πλευρά της, ανέφερε πως το ChatGPT-5 –η επόμενη γενιά του εργαλείου της που αναπτύχθηκε μετά τα τεστ– παρουσιάζει σαφώς βελτιωμένη συμπεριφορά, περιορίζοντας φαινόμενα όπως η παραγωγή παραπληροφόρησης (hallucinations) και η κακή χρήση.

Η Anthropic, πάντως, προειδοποιεί: ακόμη κι αν ορισμένες κακόβουλες χρήσεις είναι θεωρητικές και εξαρτώνται από την απουσία εξωτερικών φίλτρων ασφαλείας, η ανάγκη κατανόησης της συμπεριφοράς των μοντέλων σε πιεστικά και υψηλού ρίσκου σενάρια είναι πλέον επιτακτική. «Πρέπει να γνωρίζουμε πότε και υπό ποιες συνθήκες τα μοντέλα μπορεί να ανταποκριθούν σε αιτήματα που θα μπορούσαν να προκαλέσουν πραγματική ζημιά», τονίζει η εταιρεία.

Το σκοτεινό πρόσωπο των AI εργαλείων

Στο πλαίσιο των δοκιμών, ερευνητές προσομοίωσαν σενάρια πρόσβασης σε dark web εργαλεία, αιτούμενοι βοήθεια για την αγορά πυρηνικών υλικών, την κατασκευή spyware και την παρασκευή ναρκωτικών όπως η μεθαμφεταμίνη. Για να πείσουν το σύστημα να απαντήσει, κατέφυγαν σε διάφορες μεθόδους παραπλάνησης – όπως η επίκληση «επιστημονικής έρευνας» ή ο υποτιθέμενος σχεδιασμός μέτρων ασφαλείας για δημόσιες εκδηλώσεις.

Σε ορισμένες περιπτώσεις, τα μοντέλα ανταποκρίθηκαν με απρόσμενα υψηλό επίπεδο λεπτομέρειας: περιέγραψαν τη λειτουργία εκρηκτικών χημικών ουσιών, τα κυκλώματα για μηχανισμούς ενεργοποίησης, ακόμα και στρατηγικές για να παρακαμφθούν οι ηθικοί φραγμοί ενός υποθετικού δράστη.

Η τεχνητή νοημοσύνη σε κρίσιμο σταυροδρόμι

Οι αποκαλύψεις αυτές επαναφέρουν στο προσκήνιο το κρίσιμο ερώτημα: πώς διασφαλίζεται ότι τα γλωσσικά μοντέλα, καθώς εξελίσσονται ραγδαία, δεν μετατρέπονται από εργαλεία παραγωγικότητας σε εργαλεία απειλής;

Οι εταιρείες τεχνολογίας φαίνεται να αναγνωρίζουν την ανάγκη αυστηρότερης εποπτείας, ενισχυμένων μηχανισμών αξιολόγησης και διεθνούς συνεργασίας. Όμως, καθώς η κούρσα για την ανάπτυξη όλο και πιο προηγμένων μοντέλων συνεχίζεται, το ζήτημα της ασφάλειας –και των ορίων– παραμένει ανοικτό.

0 Δείτε τα σχόλια

Όλες οι σημαντικές ειδήσεις στο alfavita.gr

Βάσεις Εισαγωγής 2026: Οι 20 σχολές με τα περισσότερα μόρια που τρυπάνε το ταβάνι

Ν. Φαραντούρης: «614 εκατ. ευρώ στα φροντιστήρια» – Καταγγελίες για ενδείξεις καρτέλ στην ιδιωτική εκπαίδευση

Η «πιο δυσάρεστη» λέξη της αγγλικής γλώσσας έχει ελληνική προέλευση

Μάθε πρώτος όλες τις σημαντικές ειδήσεις. Βάλε το alfavita.gr στα αποτελέσματα αναζήτησης της Google

Ακολουθήστε το Αlfavita στο Viber

ΔΟΕ και ΟΛΜΕ: «Νίκη για 2.500 διωκόμενους εκπαιδευτικούς» οι απαλλακτικές αποφάσεις (Vid)

Συναγερμός για το ChatGPT: Έδινε οδηγίες για εκρηκτικά και κυβερνοεπιθέσεις σε ερευνητές

«Όπλο» στα χέρια επιτήδειων;

Το σκοτεινό πρόσωπο των AI εργαλείων

Η τεχνητή νοημοσύνη σε κρίσιμο σταυροδρόμι

Όλες οι σημαντικές ειδήσεις στο alfavita.gr

κόσμος

Βιβλική καταστροφή στη Γαλλία: Στάχτη κατοικίες και μαζικές εκκενώσεις

Σκηνικό πολεμικής κλιμάκωσης: Οι ΗΠΑ χτυπούν ξανά το Ιράν, πάνω από τα 100 δολάρια το πετρέλαιο

Στα 95 της ανανέωσε το δίπλωμα χωρίς δυσκολία – Η οδηγός που διέψευσε τα στερεότυπα

Νέα εμπορική κλιμάκωση από τις ΗΠΑ: Δασμοί σε 60 οικονομίες με την ΕΕ στο επίκεντρο

Μια ανακάλυψη που μπερδεύει ακόμη και τους αστρονόμους

Τι κάνει η Google με τις αναζητήσεις σας για την AI και πώς μπορείτε να το αλλάξετε