ChatGPT ide o dve veci: Ako AI chatbot zmenil životy vedcov
ChatGPT má dva roky a prináša revolúciu vo výskume: Ako chatbot AI zmenil životy vedcov.

ChatGPT ide o dve veci: Ako AI chatbot zmenil životy vedcov
Za dva roky odvtedy Zdieľanie ChatGPT pre verejnosť, výskumníci ho používajú na komunikáciu svojich zlepšiť vedecké texty, preskúmať vedeckú literatúru a Napíšte kód na analýzu údajov. Zatiaľ čo niektorí veria, že chatbot, ktorý sa stal populárnym 30. novembra 2022, zvyšuje produktivitu vedcov, iní sa obávajú, že on Plagiátorstvo je jednoduchšie, uvádza nepresnosti vo výskumných článkoch a spotrebuje veľké množstvo energie.
Vydavateľstvo Wiley so sídlom v Hobokene v New Jersey uskutočnilo v marci a apríli prieskum medzi 1 043 výskumníkmi o ich používaní generatívnych nástrojov AI, ako je ChatGPT, a podelilo sa o predbežné výsledky s Nature. 80 percent respondentov uviedlo, že ChatGPT používajú buď osobne alebo profesionálne, čo z neho robí najpoužívanejší nástroj medzi akademickými pracovníkmi. Tri štvrtiny respondentov sa domnievali, že v nasledujúcich 5 rokoch bude pre výskumníkov dôležité rozvíjať schopnosti AI, aby mohli vykonávať svoju prácu.
„Textové procesory AI existovali už predtým, ale s vydaním týchto veľmi výkonných veľkých jazykových modelov nastal významný posun,“ vysvetľuje James Zou, výskumník AI na Stanfordskej univerzite v Kalifornii. Katalyzátorom tejto zmeny bol chatbot ChatGPT, ktorý vyvinula technologická firma OpenAI so sídlom v San Franciscu.
Pri príležitosti druhých narodenín ChatGPT zhromaždila príroda údaje o používaní a hovorila s vedcami o tom, ako ChatGPT zmenila oblasť výskumu.
ChatGPT v číslach
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
Pomocník pri písaní
Všetky tieto čísla, určené vyhodnotením vzorov a kľúčových slov v textoch, ktoré sú charakteristické pre LLM, sú pravdepodobne konzervatívne odhady, hovorí Debora Weber-Wulff, počítačová vedkyňa a výskumníčka plagiátov z HTW Berlin. Ich práca ukazuje, že detekčné nástroje často zlyhávajú, pokiaľ ide o určenie, či bola práca napísaná s pomocou AI 5.
Za posledné dva roky vedci zistili, že používanie ChatGPT na vytváranie abstraktov, ako aj žiadostí o grant a listov podpory pre študentov im umožňuje sústrediť sa na zložité úlohy. „Veci, ktoré stoja za náš čas, sú ťažké otázky a kreatívne hypotézy,“ hovorí Milton Pividori, medicínsky informatik z University of Colorado School of Medicine v Aurore.
Výskumníci uvádzajú, že LLM sú obzvlášť užitočné pri prekonávaní jazykových bariér. „Demokratizuje písanie a pomáha ľuďom, pre ktorých je angličtina druhým jazykom,“ vysvetľuje Gabe Gomes, chemik z Carnegie Mellon University v Pittsburghu v Pensylvánii. Analýza zverejnená na predtlačovom serveri SSRN pred novembrovým odborným posudkom zistila, že kvalita písania v prácach autorov, ktorých prvým jazykom nie je angličtina, sa po publikácii ChatGPT zlepšila viac ako pri písaní autorov, ktorí hovoria plynule anglicky. 6.
Od svojho vydania v roku 2022 prešiel ChatGPT niekoľkými vylepšeniami. GPT-4, uverejnené v marci 2023, zapôsobila na používateľov svojou schopnosťou vytvárať texty podobné ľuďom. Najnovší model, o1, ktorá bola oznámená v septembri OpenAI, ktorá je dostupná pre niektorých platiacich zákazníkov, ako aj pre niektorých vývojárov v testovaní, hovorí, že dokáže „analyzovať zložité úlohy a riešiť zložitejšie problémy ako predchádzajúce modely vo vede, programovaní a matematike“. Kyle Kabasares, dátový vedec z Bay Area Environmental Research Institute v Moffett Field v Kalifornii, použil o1 na reprodukovať nejaký kód z jeho doktorandského projektu. Keď zadal informácie zo sekcie metód vo svojom výskumnom dokumente, systém AI napísal kód len za hodinu, čo mu zabralo takmer rok jeho postgraduálneho štúdia.
Obmedzenia a potenciál
Jednou z oblastí, kde boli ChatGPT a podobné systémy AI menej úspešné, je vykonávanie recenzií literatúry, hovorí Pividori. „V skutočnosti nám nepomáhajú byť produktívnejšími,“ vysvetľuje, pretože výskumník si musí prečítať a pochopiť príslušné články v plnom rozsahu. „Ak tento dokument nie je ústredným bodom vášho výskumu, možno budete môcť použiť nástroje AI na jeho zhrnutie,“ dodáva. Ukázalo sa však, že LLM majú halucinácie 7 – to znamená, že tvoria informácie. Mohli by napríklad rozprávať o číslach, ktoré ani v článku neexistujú.
Ďalším problémom pre výskumníkov pri používaní LLM je ochrana údajov. Napríklad, keď vedci vložia nepublikované pôvodné údaje do jedného z týchto nástrojov AI na napísanie článku, existuje riziko, že obsah sa použije na školenie aktualizovaných verzií týchto modelov. „Toto sú čierne skrinky,“ vysvetľuje Weber-Wulff. "Nemáte potuchy, čo sa stane s údajmi, ktoré tam nahráte."
Aby sa tomuto riziku vyhli, niektorí výskumníci si namiesto ChatGPT vyberajú menšie, lokálne modely. „Spustíte ho na svojom počítači a nič sa nezdieľa externe,“ hovorí Pividori. Dodáva, že niektoré plány predplatného ChatGPT zabezpečujú, že vaše údaje sa nepoužijú na trénovanie modelu.
Veľkou otázkou, ktorou sa výskumníci za posledný rok zaoberali, je, či ChatGPT presiahne rolu virtuálneho asistenta a vedec AI môže byť. Niektoré skoré snahy naznačujú, že je to možné. Zou vedie vývoj virtuálneho laboratória, v ktorom rôzne LLM preberajú úlohu vedcov v interdisciplinárnom tíme, zatiaľ čo ľudský vedec poskytuje spätnú väzbu na vysokej úrovni. „Spolupracujú na formulovaní nových výskumných projektov,“ hovorí. Minulý mesiac Zou a jeho kolegovia zverejnili výsledky jedného z týchto projektov na predtlačovom serveri bioRxiv pred partnerským hodnotením 8. Virtuálne laboratórium navrhlo nanobody – typ malej protilátky – schopné viazať sa na varianty koronavírusu SARS-CoV-2, ktorý spôsobil pandémiu COVID-19. Ľudskí výskumníci overili prácu prostredníctvom experimentov a identifikovali dvoch sľubných kandidátov na ďalšie štúdium.
Gomes a jeho kolegovia sú tiež nadšení z možnosti použitia ChatGPT v laboratóriu. Ona použite nástroj na vykonanie viacerých chemických reakcií pomocou robotického systému, ktorý nasadili koncom minulého roka. „Očakávame, že tieto modely budú schopné objaviť novú vedu,“ hovorí Gomes.
-
Gray, A. Predtlač na arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
-
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Predtlač na arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
-
Liang, W. a kol. Predtlač na arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
-
Liang, W. a kol. Predtlač na arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
-
Weber-Wulff, D. a kol. Int. J. Educ. integrovať. 19, 26 (2023).
-
Liang, Y., Yang, T. & Zhu, F. Predtlač na SSRN https://doi.org/10.2139/ssrn.4992755 (2024).
-
Farquhar, S. a kol. Príroda 630, 625–630 (2024).
-
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Preprint on bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).