ChatGPT on kaks: kuidas AI-vestlusbot muutis teadlaste elu
ChatGPT saab kaheaastaseks ja muudab teadustöös revolutsiooni: kuidas AI-vestlusbot on teadlaste elu muutnud.

ChatGPT on kaks: kuidas AI-vestlusbot muutis teadlaste elu
Kahe aasta jooksul alates ChatGPT jagamine avalikkusele kasutavad teadlased seda oma teadustekste täiustada, tutvuda teaduskirjandusega ja Kirjutage andmete analüüsimiseks kood. Kuigi mõned usuvad, et 30. novembril 2022 populaarseks saanud vestlusbot, suurendab teadlaste produktiivsust, teised kardavad, et ta Plagiaat on muutunud lihtsamaks, tutvustab ebatäpsusi teadusartiklites ja kulutab suurel hulgal energiat.
New Jerseys asuv kirjastus Hoboken küsitles märtsis ja aprillis 1043 teadlast, kuidas nad kasutavad generatiivseid AI-tööriistu, nagu ChatGPT, ja jagas esialgseid tulemusi Nature'iga. 80 protsenti vastanutest teatas, et kasutasid ChatGPT-d kas isiklikult või tööalaselt, mistõttu on see õppejõudude seas enimkasutatav tööriist. Kolmveerand vastanutest uskus, et järgmise 5 aasta jooksul on oluline, et teadlased arendaksid oma töö tegemiseks tehisintellekti võimeid.
"AI tekstitöötlusprogrammid eksisteerisid varem, kuid nende väga võimsate suurte keelemudelite väljalaskmisega toimus märkimisväärne nihe," selgitab California Stanfordi ülikooli tehisintellekti teadlane James Zou. Selle muutuse katalüsaatoriks oli vestlusbot ChatGPT, mille töötas välja San Franciscos asuv tehnoloogiafirma OpenAI.
Nature pani ChatGPT teise sünnipäeva tähistamiseks kokku kasutusandmed ja rääkis teadlastele, kuidas ChatGPT on muutnud uurimismaastikku.
ChatGPT numbrites
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
Kirjutamise assistent
Kõik need arvud, mis on määratud LLM-idele iseloomulike tekstide mustrite ja märksõnade hindamisel, on tõenäoliselt konservatiivsed hinnangud, ütleb HTW Berlini arvutiteadlane ja plagiaadiuurija Debora Weber-Wulff. Nende töö näitab, et tuvastamistööriistad ebaõnnestuvad sageli, kui on vaja kindlaks teha, kas paber on kirjutatud tehisintellekti abiga 5.
Viimase kahe aasta jooksul on teadlased avastanud, et ChatGPT kasutamine abstraktide, aga ka üliõpilastele mõeldud stipendiumitaotluste ja toetuskirjade koostamiseks võimaldab neil keskenduda keerukatele ülesannetele. "Asjad, mis on meie aega väärt, on rasked küsimused ja loomingulised hüpoteesid," ütleb Milton Pividori, Auroras asuva Colorado ülikooli meditsiinikooli meditsiiniinformaatik.
Teadlased teatavad, et LLM-id on eriti kasulikud keelebarjääride ületamisel. "See demokratiseerib kirjutamist ja aitab inimesi, kelle jaoks inglise keel on teine keel," selgitab Pennsylvanias Pittsburghis asuva Carnegie Melloni ülikooli keemik Gabe Gomes. Eeltrükiserveris SSRN enne eksperdihinnangut novembris avaldatud analüüs näitas, et autorite, kelle emakeel ei ole inglise keel, kirjutamise kvaliteet paranes pärast ChatGPT avaldamist rohkem kui inglise keelt valdavate autorite kirjutamise kvaliteet. 6.
Alates selle avaldamisest 2022. aastal on ChatGPT-d läbinud mitmeid uuendusi. GPT-4, avaldati märtsis 2023, avaldas kasutajatele muljet oma võimega luua inimsarnaseid tekste. Uusim mudel, o1, mis kuulutati välja septembris OpenAI sõnul suudab see "analüüsida keerulisi ülesandeid ja lahendada keerulisemaid probleeme kui varasemad teaduse, programmeerimise ja matemaatika mudelid." Californias Moffett Fieldis asuva Bay Area keskkonnauuringute instituudi andmeteadlane Kyle Kabasares kasutas o1 reprodutseerida mõnda koodi oma doktoritööst. Kui ta sisestas teabe oma uurimistöö meetodite jaotisest, kirjutas AI-süsteem vaid tunniga koodi, mille loomiseks kulus tal peaaegu aasta kraadiõpinguid.
Piirangud ja potentsiaal
Üks valdkond, kus ChatGPT ja sarnased AI-süsteemid on olnud vähem edukad, on kirjanduse ülevaadete läbiviimine, ütleb Pividori. "Need ei aita meil tegelikult produktiivsemad olla," selgitab ta, sest teadlane peab vastavad artiklid täielikult läbi lugema ja neist aru saama. "Kui paber ei ole teie uurimistöös kesksel kohal, võite selle kokkuvõtte tegemiseks kasutada AI tööriistu, " lisab ta. Kuid on näidatud, et LLM-id hallutsineerivad 7 – see tähendab, et nad moodustavad teabe. Näiteks võiksid nad rääkida numbritest, mida isegi artiklis ei eksisteeri.
Teine probleem, mis teadlaste jaoks LLM-ide kasutamisel tekitab, on andmekaitse. Näiteks kui teadlased sisestavad paberi kirjutamiseks ühte nendest tehisintellekti tööriistadest avaldamata algandmeid, on oht, et sisu kasutatakse nende mudelite värskendatud versioonide koolitamiseks. "Need on mustad kastid," selgitab Weber-Wulff. "Teil pole aimugi, mis sinna üles laaditud andmetega juhtub."
Selle riski vältimiseks valivad mõned teadlased ChatGPT asemel väiksemad kohalikud mudelid. "Käitate seda oma arvutis ja midagi ei jagata väliselt, " ütleb Pividori. Ta lisab, et teatud ChatGPT liitumisplaanid tagavad, et teie andmeid ei kasutata mudeli koolitamiseks.
Suur küsimus, mida teadlased on viimase aasta jooksul uurinud, on see, kas ChatGPT läheb kaugemale virtuaalse assistendi rollist ja AI teadlane võib olla. Mõned varased jõupingutused viitavad sellele, et see on võimalik. Zou juhib virtuaallabori väljatöötamist, kus mitmed LLM-id võtavad teadlaste rolli interdistsiplinaarses meeskonnas, samal ajal kui inimteadlane annab kõrgetasemelist tagasisidet. "Nad töötavad koos, et sõnastada uusi uurimisprojekte, " ütleb ta. Eelmisel kuul avaldasid Zou ja tema kolleegid enne eksperdihinnangut ühe sellise projekti tulemused trükieelses serveris bioRxiv 8. Virtuaalses laboris kavandati nanokehad – teatud tüüpi väikesed antikehad –, mis on võimelised seonduma COVID-19 pandeemia põhjustanud SARS-CoV-2 koroonaviiruse variantidega. Inimeste uurijad kinnitasid tööd katsetega ja tuvastasid kaks paljutõotavat kandidaati edasiseks uurimiseks.
Gomes ja tema kolleegid on samuti põnevil võimalusest kasutada ChatGPT-d laboris. Ta kasutage tööriista mitme keemilise reaktsiooni läbiviimiseks kasutades robotsüsteemi, mille nad kasutasid eelmise aasta lõpus. "Ootus on, et need mudelid suudavad avastada uut teadust, " ütleb Gomes.
-
Gray, A. Preprint on arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
-
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Preprint on arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
-
Liang, W. et al. Eeltrükk rakenduses arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
-
Liang, W. et al. Eeltrükk rakenduses arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
-
Weber-Wulff, D. et al. Int. J. Educ. Integr. 19, 26 (2023).
-
Liang, Y., Yang, T. & Zhu, F. Eeltrükk SSRN-il https://doi.org/10.2139/ssrn.4992755 (2024).
-
Farquhar, S. et al. Nature 630, 625–630 (2024).
-
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Preprint on bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).