ChatGPT je dvojí: Jak AI chatbot změnil životy vědců
ChatGPT má dva roky a přináší revoluci ve výzkumu: Jak chatbot AI změnil životy vědců.

ChatGPT je dvojí: Jak AI chatbot změnil životy vědců
Během dvou let poté Sdílení ChatGPT k veřejnosti, výzkumníci ji používají ke sdělování svých zlepšit vědecké texty, prostudovat vědeckou literaturu a Napište kód pro analýzu dat. Zatímco někteří věří, že chatbot, který se stal populárním 30. listopadu 2022, zvyšuje produktivitu vědců, jiní se obávají, že on Plagiátorství je jednodušší, uvádí nepřesnosti ve výzkumných článcích a spotřebovává velké množství energie.
Vydavatelství Wiley se sídlem v Hobokenu v New Jersey provedlo v březnu a dubnu průzkum mezi 1 043 výzkumníky ohledně jejich používání generativních nástrojů umělé inteligence, jako je ChatGPT, a podělilo se o předběžné výsledky s Nature. Osmdesát procent respondentů uvedlo, že ChatGPT používají buď osobně, nebo profesionálně, což z něj činí nejrozšířenější nástroj mezi akademiky. Tři čtvrtiny respondentů se domnívaly, že v příštích 5 letech bude pro výzkumníky důležité rozvíjet schopnosti umělé inteligence, aby mohli vykonávat svou práci.
„Textové procesory umělé inteligence existovaly již dříve, ale s uvedením těchto velmi výkonných velkých jazykových modelů nastal významný posun,“ vysvětluje James Zou, výzkumník umělé inteligence na Stanfordské univerzitě v Kalifornii. Katalyzátorem této změny byl chatbot ChatGPT, vyvinutý technologickou firmou OpenAI se sídlem v San Franciscu.
U příležitosti druhých narozenin ChatGPT sestavil Nature data o využití a mluvil s vědci o tom, jak ChatGPT změnila oblast výzkumu.
ChatGPT v číslech
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
Pomocník při psaní
Všechna tato čísla, určená vyhodnocením vzorců a klíčových slov v textech, které jsou charakteristické pro LLM, jsou pravděpodobně konzervativní odhady, říká Debora Weber-Wulff, počítačová vědkyně a výzkumnice plagiátorství z HTW Berlin. Jejich práce ukazuje, že detekční nástroje často selhávají, pokud jde o určení, zda byla práce napsána s pomocí AI 5.
Během posledních dvou let vědci zjistili, že používání ChatGPT k vytváření abstraktů, stejně jako grantových žádostí a dopisů s podporou pro studenty, jim umožňuje soustředit se na složité úkoly. „Věci, které stojí za náš čas, jsou těžké otázky a kreativní hypotézy,“ říká Milton Pividori, lékařský informatik z University of Colorado School of Medicine v Auroře.
Výzkumníci uvádějí, že LLM jsou zvláště užitečné při překonávání jazykových bariér. „Demokratizuje psaní a pomáhá lidem, pro které je angličtina druhým jazykem,“ vysvětluje Gabe Gomes, chemik z Carnegie Mellon University v Pittsburghu v Pensylvánii. Analýza zveřejněná na předtiskovém serveru SSRN před listopadovým peer review zjistila, že kvalita psaní článků autorů, jejichž mateřským jazykem není angličtina, se po publikaci ChatGPT zlepšila více než psaní autorů, kteří mluví plynně anglicky. 6.
Od svého vydání v roce 2022 prošel ChatGPT několika aktualizacemi. GPT-4, zveřejněno v březnu 2023, zapůsobila na uživatele svou schopností generovat texty podobné lidem. Nejnovější model, o1, který byl oznámen v září OpenAI, která je dostupná některým platícím zákazníkům i některým vývojářům v testování, říká, že dokáže „analyzovat složité úkoly a řešit složitější problémy než předchozí modely ve vědě, programování a matematice“. Kyle Kabasares, datový vědec z Bay Area Environmental Research Institute v Moffett Field v Kalifornii, použil o1 k reprodukovat nějaký kód z jeho doktorského projektu. Když zadal informace ze sekce metod ve své výzkumné práci, systém AI napsal kód za pouhou hodinu, což mu zabralo téměř rok jeho postgraduálního studia.
Omezení a potenciál
Jednou z oblastí, kde byly ChatGPT a podobné systémy umělé inteligence méně úspěšné, je provádění recenzí literatury, říká Pividori. „Ve skutečnosti nám nepomohou být produktivnější,“ vysvětluje, protože výzkumník si musí přečíst a pochopit příslušné články v plném rozsahu. „Pokud tento dokument není ústředním bodem vašeho výzkumu, můžete jej shrnout pomocí nástrojů AI,“ dodává. Ale bylo prokázáno, že LLM mají halucinace 7 – to znamená, že tvoří informace. Mohli by například mluvit o číslech, která v článku ani neexistují.
Další starostí výzkumníků při používání LLM je ochrana dat. Když například vědci vloží nepublikovaná původní data do jednoho z těchto nástrojů umělé inteligence, aby napsali práci, existuje riziko, že obsah bude použit k trénování aktualizovaných verzí těchto modelů. "To jsou černé skříňky," vysvětluje Weber-Wulff. "Nemáte ponětí, co se stane s daty, která tam nahrajete."
Aby se tomuto riziku vyhnuli, volí někteří výzkumníci místo ChatGPT menší, lokální modely. „Spustíte to na svém počítači a nic není sdíleno externě,“ říká Pividori. Dodává, že některé plány předplatného ChatGPT zajišťují, že vaše data nebudou použita k trénování modelu.
Velkou otázkou, kterou se výzkumníci za poslední rok zabývali, je, zda ChatGPT přesáhne roli virtuálního asistenta a vědec AI může být. Některé rané snahy naznačují, že je to možné. Zou vede vývoj virtuální laboratoře, ve které různé LLM přebírají roli vědců v interdisciplinárním týmu, zatímco lidský vědec poskytuje zpětnou vazbu na vysoké úrovni. „Spolupracují na formulování nových výzkumných projektů,“ říká. Minulý měsíc Zou a jeho kolegové zveřejnili výsledky jednoho z těchto projektů na předtiskovém serveru bioRxiv před vzájemným hodnocením 8. Virtuální laboratoř navrhla nanoprotilátky – typ malé protilátky – schopné vázat se na varianty koronaviru SARS-CoV-2, který způsobil pandemii COVID-19. Lidští vědci ověřili práci pomocí experimentů a identifikovali dva slibné kandidáty pro další studium.
Gomes a jeho kolegové jsou také nadšeni z možnosti použití ChatGPT v laboratoři. Ona používat nástroj k provádění více chemických reakcí pomocí robotického systému, který nasadili koncem minulého roku. "Očekává se, že tyto modely budou schopny objevit novou vědu," říká Gomes.
-
Gray, A. Předtisk na arXiv https://doi.org/10.48550/arXiv.2403.16887 (2024).
-
Kobak, D., González-Márquez, R., Horvát, E.-Á. & Lause, J. Předtisk na arXiv https://doi.org/10.48550/arXiv.2406.07016 (2024).
-
Liang, W. et al. Předtisk na arXiv https://doi.org/10.48550/arXiv.2404.01268 (2024).
-
Liang, W. a kol. Předtisk na arXiv https://doi.org/10.48550/arXiv.2403.07183 (2024).
-
Weber-Wulff, D. a kol. Int. J. Educ. Integrovat. 19, 26 (2023).
-
Liang, Y., Yang, T. & Zhu, F. Předtisk na SSRN https://doi.org/10.2139/ssrn.4992755 (2024).
-
Farquhar, S. a kol. Příroda 630, 625–630 (2024).
-
Swanson, K., Wu, W., Bulaong, N. L., Pak, J. E. & Zou, J. Preprint on bioRxiv https://doi.org/10.1101/2024.11.11.623004 (2024).