Humanity’s Last Exam: Η Τεχνητή Νοημοσύνη «ισοπεδώνει» τη γνώση
Η Τεχνητή Νοημοσύνη ετοιμάζεται να «ισοπεδώσει» το δυσκολότερο τεστ γνώσεων στον πλανήτη

Η στιγμή που η Τεχνητή Νοημοσύνη (AI) θα ξεπεράσει σε όγκο και βάθος γνώσεων το σύνολο της παγκόσμιας ακαδημαϊκής κοινότητας δεν αποτελεί πλέον σενάριο επιστημονικής φαντασίας, αλλά ζήτημα ελάχιστων μηνών.

Το τελευταίο οχυρό της ανθρώπινης πνευματικής κυριαρχίας, το διαβόητο τεστ «Humanity’s Last Exam (HLE)», ετοιμάζεται να υποκύψει στη φρενήρη υπολογιστική ισχύ των νέων μοντέλων.

Πρόκειται για μια εξέλιξη που ανατρέπει τα πάντα στον τομέα της γνώσης, καθώς το HLE δεν είναι ένα απλό ερωτηματολόγιο, αλλά μια «σφαγή» 2.500 ερωτήσεων επιπέδου PhD (Διδακτορικού), που καλύπτουν από την αστροφυσική και την πυραυλική έως τη μυθολογία και τη φυσιολογία.

Από το ταπεινό 3% στην απόλυτη κυριαρχία

Η πρόοδος είναι σοκαριστική. Πριν από μόλις δύο χρόνια, το ChatGPT της OpenAI έμοιαζε με «μαθητή του δημοτικού» μπροστά στις απαιτήσεις του τεστ, σημειώνοντας ένα πενιχρό 3%.

Σήμερα, ο χάρτης έχει αλλάξει άρδην. Το Gemini της Google εκτοξεύθηκε από το 18,8% στο εντυπωσιακό 45,9% μέσα σε ελάχιστο χρόνο. Το Claude της Anthropic ακολουθεί κατά πόδας με 34,2%, βελτιώνοντας τις επιδόσεις του με γεωμετρική πρόοδο.

Ο Κάλβιν Ζανγκ, επικεφαλής έρευνας στη Scale (την εταιρεία που δημιούργησε το HLE), είναι σαφής: «Θέλαμε να δημιουργήσουμε ένα ακαδημαϊκό benchmark κλειστού τύπου στο επίπεδο των κορυφαίων ειδικών ανθρώπων, που μόνο ελάχιστοι στον κόσμο μπορούν πραγματικά να λύσουν». Πλέον, το τέλειο σκορ θεωρείται θέμα χρόνου.

«Deep Blue» της γνώσης: Το τέλος των ανθρώπινων benchmarks

Η επικείμενη επικράτηση της AI στο HLE συγκρίνεται από πολλούς με την ιστορική νίκη του Deep Blue επί του Γκάρι Κασπάροφ στο σκάκι το 1997. Όπως τότε το σκάκι έπαψε να θεωρείται το απόλυτο μέτρο ανθρώπινης ευφυΐας, έτσι και σήμερα τα ακαδημαϊκά benchmarks «καίγονται» το ένα μετά το άλλο.

Η Κέιτ Ολζέσβκα, product manager στη DeepMind της Google, επισημαίνει τη δουλειά που έχει γίνει στον τομέα του συλλογισμού: «Τα τελευταία χρόνια έχουμε δει απίστευτη πρόοδο σε αυτά τα γλωσσικά μοντέλα. Είναι εντυπωσιακό, οι δημιουργοί μοντέλων έχουν κάνει εξαιρετική δουλειά στη βελτίωση των δυνατοτήτων συλλογισμού. Αν αυτό ήταν το μοναδικό μας μέλημα πιστεύω ότι θα μπορούσαμε να φτάσουμε εκεί πολύ γρήγορα».

Τι σημαίνει η «πτώση» του HLE για την ανθρωπότητα;

Όταν τα συστήματα AI επιτύχουν το 100%, η επιστήμη θα εισέλθει σε αχαρτογράφητα νερά. Θα έχουμε δημιουργήσει έναν «καθολικό ειδικό» που θα κατέχει γνώσεις που κανένας άνθρωπος δεν μπορεί να συγκρατήσει ταυτόχρονα.

Σύμφωνα με τους ερευνητές, αν η τεχνολογία κατακτήσει το HLE, το επόμενο βήμα θα είναι η αξιολόγησή της με ερωτήσεις των οποίων οι απαντήσεις δεν είναι γνωστές σε κανέναν άνθρωπο.

Η «ακτινογραφία» του HLE:

  • 70.000 ερωτήσεις υποβλήθηκαν αρχικά από ειδικούς σε 50 χώρες.

  • 500.000 δολάρια δόθηκαν ως έπαθλα για τη δημιουργία της βάσης δεδομένων.

  • 2.500 ερωτήσεις επιλέχθηκαν τελικά, πολλές εκ των οποίων παραμένουν μυστικές για να αποφευχθεί η «αποστήθιση» από τα μοντέλα.

Παρά την τεχνολογική υπεροχή, οι ειδικοί καθησυχάζουν: η ανθρώπινη κρίση, η δημιουργικότητα και η πρακτική εφαρμογή (π.χ. χειρουργική) παραμένουν πεδία όπου ο άνθρωπος διατηρεί τα πρωτεία.

Όπως τονίζει η Ολζέσβκα, «καθώς η AI πλησιάζει στο σημείο να κατακτήσει τεστ που έχουν σχεδιαστεί από ανθρώπους η επέκταση πέρα από τα όρια της ανθρώπινης γνώσης γίνεται ολοένα και πιο βασικός στόχος των δημιουργών».

Όλες οι σημαντικές και έκτακτες ειδήσεις σήμερα

Στην τάξη υποχρεωτικά από 6 έως 17 Ιουλίου 135.000 εκπαιδευτικοί

Από 1η Σεπτεμβρίου τα μαθήματα – Στις 27 Αυγούστου να επιστρέφουν οι εκπαιδευτικοί

Αλλαγή νόμου: ΝΕΑ εξ αποστάσεως Πιστοποίηση Η/Υ για Προσλήψεις Εκπαιδευτικών

Google news logo Ακολουθήστε το Alfavita στo Google News Viber logo Ακολουθήστε το Alfavita στo Viber

σχετικά άρθρα

βουνό
Το ελληνικό «δέντρο-φάρμακο» στη μάχη κατά του καρκίνου
Οι πληθυσμοί αυτοί αποτελούν μια ανεκτίμητη φυσική πηγή ουσιών, οι οποίες αξιοποιούνται ήδη για την παραγωγή ευρέως γνωστών αντικαρκινικών σκευασμάτων
Το ελληνικό «δέντρο-φάρμακο» στη μάχη κατά του καρκίνου
μητροπουλος
Αλέξης Μητρόπουλος: Αίτημα για έκτακτο επίδομα Πάσχα 300 ευρώ και νέα αύξηση 3% στις συντάξεις
Σε απόγνωση οι χαμηλοσυνταξιούχοι: Το 54% ζει με λιγότερα από 940 ευρώ τον μήνα
Αλέξης Μητρόπουλος: Αίτημα για έκτακτο επίδομα Πάσχα 300 ευρώ και νέα αύξηση 3% στις συντάξεις
egkefalos
Γιατί ο εγκέφαλος ξεχνάει κάποια πράγματα τόσο γρήγορα;
Για να διατηρήσει την αποδοτικότητά του και να μην καταρρεύσει υπό το βάρος των δεδομένων, αναγκάζεται να προβαίνει σε συνεχή εκκαθάριση άχρηστων...
Γιατί ο εγκέφαλος ξεχνάει κάποια πράγματα τόσο γρήγορα;