Η τεχνητή νοημοσύνη θα αναλάβει σύντομα έργα που χρειάζονται εβδομάδες στον άνθρωπο
Η τεχνητή νοημοσύνη βελτιώνεται γρήγορα και σύντομα θα μπορούσε να αναλάβει έργα που χρειάζονται εβδομάδες για να ολοκληρωθούν οι άνθρωποι. Η ανάλυση των ειδικών δείχνει ότι κορυφαία μοντέλα τεχνητής νοημοσύνης σημειώνουν πρόοδο και θα μπορούσαν να ολοκληρώσουν εργασίες με ανθρώπινη τεχνογνωσία σε λιγότερο χρόνο μέχρι το 2029.

Η τεχνητή νοημοσύνη θα αναλάβει σύντομα έργα που χρειάζονται εβδομάδες στον άνθρωπο
Τα σημερινά συστήματα τεχνητής νοημοσύνης (AI) δεν μπορούν να ξεπεράσουν τους ανθρώπους σε μεγάλες εργασίες, αλλά εξελίσσονται ταχέως περαιτέρω και θα μπορούσε να κλείσει το χάσμα πιο γρήγορα από ό,τι περίμεναν πολλοί, σύμφωνα με ανάλυση κορυφαίων μοντέλων 1.
Η μη κερδοσκοπική METR με έδρα το Μπέρκλεϊ της Καλιφόρνια ανέπτυξε σχεδόν 170 πραγματικές εργασίες στον προγραμματισμό, την ασφάλεια στον κυβερνοχώρο, τη γενική λογική και τη μηχανική μάθηση και στη συνέχεια δημιούργησε μια «ανθρώπινη βάση» μετρώντας τον χρόνο που χρειάστηκαν οι ειδικοί για να ολοκληρώσουν αυτές τις εργασίες.
Στη συνέχεια, η ομάδα ανέπτυξε μια μέτρηση για να αξιολογήσει την πρόοδο του Μοντέλα AI, το οποίο ονομάζεται «χρονος ορίζοντας ολοκλήρωσης εργασιών». Αυτός είναι ο χρόνος που συνήθως χρειάζεται για τους προγραμματιστές να ολοκληρώσουν τις εργασίες που μπορούν να ολοκληρώσουν τα μοντέλα AI με ένα συγκεκριμένο ποσοστό επιτυχίας.
Σε μια προέκδοση που δημοσιεύτηκε αυτήν την εβδομάδα στο arXiv, το METR αναφέρει ότι το GPT-2, ένα πρώιμο μοντέλο μεγάλης γλώσσας (LLM) που κυκλοφόρησε από την OpenAI το 2019, απέτυχε σε όλες τις εργασίες που χρειάστηκαν οι ειδικοί στον άνθρωπο περισσότερο από ένα λεπτό. Το Claude 3.7 Sonnet, που κυκλοφόρησε τον Φεβρουάριο από την αμερικανική startup Anthropic, ολοκλήρωσε το 50% των εργασιών που χρειάζονταν οι άνθρωποι 59 λεπτά.
Συνολικά, ο χρονικός ορίζοντας των 13 κορυφαίων μοντέλων τεχνητής νοημοσύνης διπλασιάζεται περίπου κάθε επτά μήνες από το 2019, σύμφωνα με τη μελέτη. Η εκθετική ανάπτυξη των χρονικών οριζόντων AI επιταχύνθηκε το 2024, με τα τελευταία μοντέλα να διπλασιάζουν τον ορίζοντά τους περίπου κάθε τρεις μήνες. Το έργο δεν έχει ακόμη αναθεωρηθεί επίσημα.
Προχωρώντας από το 2019 στο 2024, το METR προτείνει ότι τα μοντέλα τεχνητής νοημοσύνης θα είναι σε θέση να ολοκληρώσουν εργασίες που χρειάζονται στους ανθρώπους περίπου ένα μήνα με αξιοπιστία 50% έως το 2029, ίσως και νωρίτερα.
Ένας μήνας αφοσιωμένης ανθρώπινης τεχνογνωσίας, προτείνει η δημοσίευση, μπορεί να είναι αρκετός για να ξεκινήσει μια νέα εταιρεία ή να γίνουν επιστημονικές ανακαλύψεις.
Ωστόσο, ο Joshua Gans, καθηγητής διαχείρισης στο Πανεπιστήμιο του Τορόντο στον Καναδά, ο οποίος έχει γράψει για τα οικονομικά της τεχνητής νοημοσύνης, εξηγεί ότι τέτοιες προβλέψεις δεν είναι ιδιαίτερα χρήσιμες. «Οι παρεκβολές είναι δελεαστικές, αλλά υπάρχουν ακόμα τόσα πολλά που δεν γνωρίζουμε για το πώς θα χρησιμοποιηθεί στην πραγματικότητα η τεχνητή νοημοσύνη για να έχουν νόημα αυτές οι προβλέψεις», λέει.
Κρίνοντας τους ανθρώπους έναντι της τεχνητής νοημοσύνης
Η ομάδα επέλεξε το ποσοστό επιτυχίας 50%, επειδή ήταν πιο ανθεκτικό σε μικρές αλλαγές στη διανομή δεδομένων. "Εάν επιλέξετε πολύ χαμηλά ή πολύ υψηλά κατώφλια, η προσθήκη ή η αφαίρεση μιας μεμονωμένης επιτυχημένης ή αποτυχημένης εργασίας αλλάζει ανάλογα την εκτίμηση", εξηγεί ο συν-συγγραφέας Lawrence Chan.
Η αύξηση της αξιοπιστίας από 50% σε 80% μείωσε τον μέσο χρονικό ορίζοντα κατά πέντε φορές - παρόλο που ο συνολικός χρόνος διπλασιασμού και η γραμμή τάσης ήταν παρόμοια.
Τα τελευταία πέντε χρόνια, έχουν γίνει βελτιώσεις στο γενικές δεξιότητες των LLMs οδηγείται κυρίως από τις αυξήσεις στην κλίμακα—τον όγκο των δεδομένων εκπαίδευσης, τον χρόνο εκπαίδευσης και τον αριθμό των παραμέτρων του μοντέλου. Η εργασία αποδίδει την πρόοδο στη μέτρηση του χρονικού ορίζοντα κυρίως σε βελτιώσεις στη λογική συλλογιστική, τη χρήση εργαλείων, τη διόρθωση σφαλμάτων και την εμπιστοσύνη των εργασιών.
Η προσέγγιση του METR για την αξιολόγηση των χρονικών οριζόντων αντιμετωπίζει ορισμένους από τους περιορισμούς των υφιστάμενων σημείων αναφοράς τεχνητής νοημοσύνης, τα οποία ταιριάζουν μόνο χαλαρά με την εργασία του πραγματικού κόσμου και γίνονται γρήγορα «κορεσμένα» καθώς βελτιώνονται τα μοντέλα. Παρέχει μια συνεχή, διαισθητική μέτρηση που αποτυπώνει καλύτερα τη σημαντική πρόοδο με την πάροδο του χρόνου, λέει ο συν-συγγραφέας Ben West.
Τα κορυφαία μοντέλα AI επιτυγχάνουν υπεράνθρωπες επιδόσεις σε πολλά Δοκιμή αναφοράς, αλλά μέχρι στιγμής είχαν σχετικά μικρό οικονομικό αντίκτυπο, εξηγεί ο West. Η τελευταία έρευνα του METR προσφέρει μια μερική απάντηση σε αυτό το παζλ: Τα καλύτερα μοντέλα δείχνουν ένα χρονικό πλαίσιο περίπου 40 λεπτών και δεν υπάρχει πολύ οικονομική εργασία που μπορεί να κάνει κάποιος σε αυτό το διάστημα, είπε ο West.
Ωστόσο, ο Anton Troynikov, ερευνητής και επιχειρηματίας τεχνητής νοημοσύνης από το Σαν Φρανσίσκο της Καλιφόρνια, εξηγεί ότι η τεχνητή νοημοσύνη θα είχε μεγαλύτερο οικονομικό αντίκτυπο εάν οι οργανισμοί ήταν πιο πρόθυμοι να πειραματιστούν και να επενδύσουν στη χρήση των μοντέλων αποτελεσματικά.
-
Kwa, Τ. et αϊ. Προεκτύπωση στο arXiv https://doi.org/10.48550/arXiv.2503.14499 (2025).