ChatGPT yra du: kaip AI pokalbių robotas pakeitė mokslininkų gyvenimus
„ChatGPT“ sukanka dveji metai ir daro revoliuciją tyrimuose: kaip AI pokalbių robotas pakeitė mokslininkų gyvenimus.

ChatGPT yra du: kaip AI pokalbių robotas pakeitė mokslininkų gyvenimus
Per dvejus metus nuo „ChatGPT“ bendrinimas visuomenei, mokslininkai ja naudojasi savo tobulinti mokslinius tekstus, peržiūrėti mokslinę literatūrą ir Parašykite kodą duomenims analizuoti. Nors kai kurie mano, kad pokalbių robotas, išpopuliarėjęs 2022 m. lapkričio 30 d. didina mokslininkų produktyvumą, kiti bijo, kad jis Palengvėjo plagiatas, įveda netikslumų moksliniuose straipsniuose ir sunaudoja daug energijos.
Hoboken, Naujajame Džersyje įsikūrusi leidykla „Wiley“ kovo ir balandžio mėn. apklausė 1 043 tyrėjus apie tai, kaip jie naudoja generatyvius AI įrankius, tokius kaip „ChatGPT“, ir pasidalijo preliminariais rezultatais su „Nature“. Aštuoniasdešimt procentų respondentų nurodė, kad ChatGPT naudojasi asmeniškai arba profesionaliai, todėl tai yra plačiausiai naudojama priemonė tarp akademikų. Trys ketvirtadaliai respondentų manė, kad per ateinančius 5 metus mokslininkams bus svarbu plėtoti dirbtinio intelekto gebėjimus, kad jie galėtų atlikti savo darbą.
„AI tekstų rengyklės egzistavo ir anksčiau, tačiau išleidus šiuos labai galingus didelių kalbų modelius įvyko reikšmingas pokytis“, – aiškina Kalifornijos Stanfordo universiteto dirbtinio intelekto tyrinėtojas Jamesas Zou. Pokalbių robotas ChatGPT, kurį sukūrė San Franciske įsikūrusi technologijų įmonė OpenAI, buvo šio pokyčio katalizatorius.
Antrojo „ChatGPT“ gimtadienio proga „Nature“ surinko naudojimo duomenis ir kalbėjo su mokslininkais apie tai, kaip „ChatGPT“ pakeitė tyrimų aplinką.
ChatGPT skaičiais
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
Rašymo asistentas
Visi šie skaičiai, nustatyti įvertinus modelius ir raktinius žodžius tekstuose, kurie būdingi LLM, tikriausiai yra konservatyvūs skaičiavimai, sako Debora Weber-Wulff, kompiuterių mokslininkė ir plagiato tyrinėtoja iš HTW Berlin. Jų darbas rodo, kad aptikimo įrankiai dažnai nepavyksta, kai reikia nustatyti, ar darbas buvo parašytas naudojant AI 5.
Per pastaruosius dvejus metus mokslininkai nustatė, kad naudojant ChatGPT kurti santraukas, taip pat paraiškas dotacijai ir paramos laiškus studentams, jie gali sutelkti dėmesį į sudėtingas užduotis. „Dalykai, kurie verti mūsų laiko, yra sunkūs klausimai ir kūrybinės hipotezės“, – sako Miltonas Pividori, medicinos informatikas iš Kolorado universiteto medicinos mokyklos Auroroje.
Tyrėjai praneša, kad LLM ypač padeda įveikti kalbos barjerus. „Jis demokratizuoja rašymą ir padeda žmonėms, kuriems anglų kalba yra antroji kalba“, – aiškina Carnegie Mellon universiteto Pitsburge, Pensilvanijoje, chemikas Gabe'as Gomesas. Analizė, paskelbta išankstinio spausdinimo serveryje SSRN prieš tarpusavio peržiūrą lapkričio mėn., parodė, kad autorių, kurių gimtoji kalba nėra anglų kalba, rašymo kokybė pagerėjo po ChatGPT publikacijos, labiau nei autorių, laisvai kalbančių anglų kalba. 6.
Nuo 2022 m. išleidimo „ChatGPT“ buvo keletą kartų atnaujintas. GPT-4, paskelbta 2023 m. kovo mėn, sužavėjo vartotojus savo gebėjimu kurti į žmones panašius tekstus. Naujausias modelis, o1, kuris buvo paskelbtas rugsėjį „OpenAI“ teigia, kad gali „analizuoti sudėtingas užduotis ir išspręsti sudėtingesnes problemas nei ankstesni mokslo, programavimo ir matematikos modeliai“. Kyle'as Kabasaresas, duomenų mokslininkas iš Bay Area aplinkos tyrimų instituto Moffett Field, Kalifornijoje, naudojo o1 atkurti tam tikrą kodą iš savo doktorantūros projekto. Kai jis įvedė informaciją iš savo tiriamojo darbo metodų skyriaus, AI sistema vos per valandą parašė kodą, kuriam sukurti prireikė beveik vienerių studijų metų.
Apribojimai ir potencialas
Viena sritis, kurioje „ChatGPT“ ir panašios AI sistemos buvo mažiau sėkmingos, yra literatūros apžvalgos, sako Pividori. „Jie tikrai nepadeda mums būti produktyvesniems“, – aiškina jis, nes tyrėjas turi perskaityti ir suprasti atitinkamus straipsnius iki galo. „Jei šis dokumentas nėra pagrindinis jūsų tyrime, galite naudoti AI įrankius, kad jį apibendrintumėte“, - priduria jis. Tačiau buvo įrodyta, kad LLM haliucinuoja 7 – tai yra, jie sudaro informaciją. Pavyzdžiui, jie galėtų kalbėti apie skaičius, kurių net nėra straipsnyje.
Kitas susirūpinimas mokslininkams naudojant LLM yra duomenų apsauga. Pavyzdžiui, kai mokslininkai į vieną iš šių dirbtinio intelekto įrankių įveda nepaskelbtus originalius duomenis, kad galėtų parašyti darbą, kyla pavojus, kad turinys bus naudojamas atnaujintoms šių modelių versijoms mokyti. „Tai juodosios dėžės“, – aiškina Weberis-Wulffas. „Jūs neįsivaizduojate, kas atsitiks su ten įkeliamais duomenimis.
Kad išvengtų šios rizikos, kai kurie mokslininkai renkasi mažesnius vietinius modelius, o ne ChatGPT. „Paleidžiate jį savo kompiuteryje ir niekas nėra bendrinamas išorėje“, - sako Pividori. Jis priduria, kad tam tikri „ChatGPT“ prenumeratos planai užtikrina, kad jūsų duomenys nebūtų naudojami modeliui mokyti.
Didelis klausimas, kurį tyrinėjo per pastaruosius metus, yra tai, ar „ChatGPT“ peržengs virtualaus asistento vaidmenį ir AI mokslininkas gali būti. Kai kurios ankstyvos pastangos rodo, kad tai įmanoma. Zou vadovauja kuriant virtualią laboratoriją, kurioje įvairūs LLM atlieka mokslininkų vaidmenį tarpdisciplininėje komandoje, o žmonių mokslininkas teikia aukšto lygio grįžtamąjį ryšį. „Jie dirba kartu kurdami naujus tyrimų projektus“, – sako jis. Praėjusį mėnesį Zou ir jo kolegos paskelbė vieno iš šių projektų rezultatus išankstinio spausdinimo serveryje bioRxiv prieš tarpusavio peržiūrą. 8. Virtuali laboratorija sukūrė nanokūnus – mažų antikūnų tipą, galinčius prisijungti prie SARS-CoV-2 koronaviruso variantų, sukėlusių COVID-19 pandemiją. Žmonių tyrinėtojai eksperimentais patvirtino darbą ir nustatė du perspektyvius kandidatus tolesniam tyrimui.
Gomesas ir jo kolegos taip pat džiaugiasi galimybe naudoti ChatGPT laboratorijoje. Ji naudokite įrankį kelioms cheminėms reakcijoms atlikti naudojant robotų sistemą, kurią jie įdiegė praėjusių metų pabaigoje. „Tikimės, kad šie modeliai galės atrasti naują mokslą“, – sako Gomesas.
-
Gray, A. Preprint on arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
-
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Preprint on arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
-
Liang, W. ir kt. Išankstinis spausdinimas ant arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
-
Liang, W. ir kt. Išankstinis spausdinimas ant arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
-
Weber-Wulff, D. ir kt. Tarpt. J. Eduk. Integr. 19, 26 (2023).
-
Liang, Y., Yang, T. & Zhu, F. Preprint on SSRN https://doi.org/10.2139/ssrn.4992755 (2024).
-
Farquhar, S. ir kt. Gamta 630, 625–630 (2024).
-
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Preprint on bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).