Μια κρυφή παράδοση στον χώρο των οικονομικών
Κάθε χρόνο, μια κλειστή ομάδα οικονομολόγων, στελεχών hedge funds και τεχνολογικών εταιρειών συμμετέχει σε έναν ιδιαίτερο διαγωνισμό προβλέψεων. Ο οικονομολόγος Ντέιβιντ Σάιφ συγκεντρώνει περίπου 30 γεγονότα από την πολιτική, την οικονομία, την επιστήμη, ακόμη και την ποπ κουλτούρα, ζητώντας από τους συμμετέχοντες να αποδώσουν πιθανότητες για το αν θα συμβούν μέσα στη χρονιά.
Για πρώτη φορά, στη διοργάνωση του 2025, ένας από τους συμμετέχοντες είχε την ιδέα να προσθέσει έναν νέο «παίκτη»: το ChatGPT.
Πώς μπήκε το ChatGPT στο παιχνίδι
Ο Σαμ Λέφελ, στέλεχος hedge fund, εισήγαγε στο ChatGPT τους περίπλοκους κανόνες του παιχνιδιού — πολλές σελίδες οδηγιών και μαθηματικών λεπτομερειών. Το σύστημα ανταποκρίθηκε άμεσα: ζήτησε τη λίστα των ερωτημάτων και μέσα σε λίγα δευτερόλεπτα παρήγαγε προβλέψεις για όλα τα γεγονότα.
Σε ορισμένες ερωτήσεις, ειδικά σε αθλητικά ή στατιστικά δεδομένα, το ChatGPT έδωσε εντυπωσιακά ακριβείς υπολογισμούς. Όμως σε θέματα που απαιτούσαν ενημέρωση για πρόσφατες εξελίξεις, υστέρησε.
Η μεγάλη δοκιμασία
Από την 1η Ιανουαρίου 2025, 160 συμμετέχοντες περίμεναν τις εξελίξεις. Κάθε φορά που ένα γεγονός επιβεβαιωνόταν ή διαψευδόταν, ο Σάιφ ενημέρωνε τη βαθμολογία. Το σύστημα μοιάζει με γκολφ: όσο μικρότερη η «απόκλιση» της πρόβλεψης από την πραγματικότητα, τόσο καλύτερο το σκορ.
Καθώς η χρονιά κυλούσε, οι συμμετέχοντες ανυπομονούσαν να δουν πώς τα πήγαινε το ChatGPT σε σχέση με τους ανθρώπους.
Τα αποτελέσματα
Όταν ο διαγωνισμός έκλεισε στα μέσα Νοεμβρίου, το ChatGPT κατέλαβε την 80ή θέση σε σύνολο 160 συμμετεχόντων.
Για ορισμένους, αυτό σήμαινε ότι η απόδοσή του ήταν απλώς «μέτρια». Για άλλους, ήταν εντυπωσιακό ότι μέσα σε λίγα λεπτά πέτυχε την ίδια επίδοση με ανθρώπους που χρειάστηκαν ώρες έρευνας και ανάλυσης.
Ωστόσο, το ChatGPT δεν ξεπέρασε ένα αξιόλογο «όριο»: αν κάποιος δήλωνε 50% πιθανότητα για τα πάντα, θα συγκέντρωνε περίπου 75.000 βαθμούς. Το ChatGPT έφτασε τους 82.925 — δηλαδή πρόσθεσε «αρνητική αξία», σύμφωνα με τον Σάιφ.
Πού ήταν καλό και πού υστέρησε
Σε προβλέψεις με πλούσια ιστορικά δεδομένα, όπως αθλητικά αποτελέσματα ή οικονομικές τάσεις, το μοντέλο φάνηκε ισχυρό. Αντίθετα, σε γεγονότα που άλλαζαν γρήγορα ή απαιτούσαν πρόσφατη ενημέρωση, απέτυχε — όπως στην περίπτωση της καθυστέρησης μιας αποστολής της NASA που το ChatGPT θεωρούσε σχεδόν βέβαιη.
Το ευρύτερο συμπέρασμα
Παρά τα αδύνατα σημεία του, μια ενδιαφέρουσα παράμετρος έμεινε στο προσκήνιο: ο χρόνος. Ενώ οι περισσότεροι συμμετέχοντες αφιέρωσαν ημέρες για να καταλήξουν στις προβλέψεις τους, το ChatGPT χρειάστηκε μόνο λίγα λεπτά.
Όπως σημειώνει ο Λέφελ, «αν δεν έχεις να προβλέψεις 30 γεγονότα, αλλά 30.000; Αν η ταχύτητα και μια “αρκετά καλή” ακρίβεια είναι αυτό που χρειάζεσαι; Τότε ίσως το ChatGPT να είναι ο πραγματικός νικητής».
Ένα παιχνίδι που φωτίζει το μέλλον της τεχνητής νοημοσύνης
Ο διαγωνισμός ανέδειξε έναν κρίσιμο παράγοντα: η ικανότητα πρόβλεψης αποτελεί έναν από τους πιο αξιόπιστους δείκτες νοημοσύνης. Και ενώ το ChatGPT δεν ξεπέρασε τους ανθρώπους, απέδειξε ότι μπορεί να λειτουργήσει με εντυπωσιακή ταχύτητα και αξιοσημείωτη επάρκεια.
Η συζήτηση παραμένει ανοιχτή: είναι η τεχνητή νοημοσύνη «όσο καλή όσο ο μέσος άνθρωπος» ή μήπως βρίσκεται ήδη σε μια διαφορετική κατηγορία όταν ο όγκος και η κλίμακα γίνονται ασύλληπτοι για τον ανθρώπινο νου;
