ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć / Shutterstock

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

 

oprac. Paweł Huczko
rozwiń więcej
Prawo
Alkohol i papierosy będą droższe. Wzrośnie akcyza. Papierosy i alkohol w Polsce już nie będą najtańsze w całej Europie.
05 lip 2024

Alkohol i papierosy będą droższe, bo wzrośnie akcyza. To element walki m.in. z nadużywaniem alkoholu. Kończą się też prace nad projektem, który ograniczy sprzedaż alkoholu na stacjach benzynowych w godzinach nocnych.

Ważny zasiłek z podwyżką od 2025 r. Kto może go otrzymać?
05 lip 2024

Od 1 stycznia 2025 r. wzrosną kryteria dochodowe w pomocy społecznej. Tak wynika z założeń projektu rozporządzenia Rady Ministrów. Ma to bezpośredni wpływ na podwyżkę maksymalnej kwoty zasiłku stałego. To ważna zmiana dla osób pobierających świadczenia. Co oznacza w praktyce?

Kolejny cios dla działkowców ROD. Od 1 lipca 2024 r. koniec z zamrożonymi cenami. Muszą być gotowi na podwyżki. Kto konkretnie?
05 lip 2024

Kolejny cios dla działkowców ROD. Od 1 lipca 2024 r. czekają ich podwyżki. Kto zapłaci więcej i o ile? Czy popularność działek będzie dalej spadała? Wzrost cen energii dotyka wszystkich. Nie oszczędzi też działkowców, którzy dotychczas korzystali z preferencyjnych stawek.

Dopłaty do zakupu mieszkania: od 78 023,00 zł w woj. łódzkim do 146 423,00 zł w Olsztynie. Wnioski można składać do końca 2024 r.
05 lip 2024

Możliwe jest uzyskanie dofinansowania zakupu mieszkania w ramach Programu „Samodzielność – Aktywność – Mobilność!” Dostępne mieszkanie. W trzecim kwartale 2024 r. wysokość dofinansowania może wynieść nawet 146423,00 zł. Wnioski o dofinansowanie można składać do 31 grudnia 2024 r.

Do 9000 zł od państwa na zakup roweru elektrycznego lub wózka rowerowego. Już od 2025 roku. NFOŚiGW konsultuje projekt programu „Mój rower elektryczny”
05 lip 2024

Narodowy Fundusz Ochrony Środowiska i Gospodarki Wodnej chce przeznaczyć od 2025 roku 300 mln zł ze środków pochodzących z Funduszu Modernizacyjnego na dopłaty do zakupu elektrycznych rowerów (w tym rowerów cargo) i wózków rowerowych. Taką dopłatę może dostać zarówno zwykły Kowalski (osoby fizyczne) ale także niektórzy przedsiębiorcy oraz samorządy. Dofinansowaniem ma być objętych przynajmniej 46 667 sztuk takich rowerów. Obecnie trwają (od 4 do 18 lipca 2024 r.) konsultacje projektu programu priorytetowego „Mój rower elektryczny”.

Nawet 1200,00 zł na rodzinę. Pobierz wniosek o bon energetyczny i złóż go 1 sierpnia 2024 r.
04 lip 2024

Bon energetyczny jest jednorazowym świadczeniem pieniężnym. Jest to forma pomocy przysługująca beneficjentom, którzy z różnych przyczyn mają trudności w pokrywaniu rachunków za energię. Bon energetyczny przysługuje za okres od 1 lipca 2024 r. do 31 grudnia 2024 r.

Mniejsza ulga na wakacyjne dopłaty. Przepisy się zmieniły i na konta trafi mniej pieniędzy, bo trzeba zapłacić podatek.
04 lip 2024

Mniejsza ulga na wakacyjne dopłaty. Przepisy się zmieniły i znacznie więcej pracowników musi zapłacić podatek. To zaś oznacza, że na ich konta trafi mniej pieniędzy. Kto straci?

Nawet 3569 zł dla rodziców ucznia w roku szkolnym 2024/25. 5 dofinansowań z których możesz skorzystać równocześnie
04 lip 2024

Chociaż dopiero rozpoczęły się wakacje, cześć rodziców myślami jest już przy budżecie na rok szkolny. Na jakie wsparcie finansowe można liczyć w roku szkolnym 2024/25? Kto może skorzystać i w jakich terminach należy składać wnioski? Podpowiadamy. 

Osoby niepełnosprawne czekają na podwyższoną rentę socjalną. Co z obywatelskim projektem?
04 lip 2024

Obywatelski projekt nowelizacji ustawy o rencie socjalnej zakładał podwyżkę tego świadczenia do kwoty minimalnego wynagrodzenia za pracę. W toku prac sejmowych kształt reformy uległ zmianie. Zaproponowane poprawki przewidują przyznanie osobie uprawnionej do renty dodatku. Na jakim obecnie etapie się znajduje się ustawa?

Egzamin ósmoklasisty 2024: Wgląd do pracy egzaminacyjnej i weryfikacja sumy punktów [wnioski, terminy, uprawnieni]
04 lip 2024

3 lipca 2024 r. zostały ogłoszone wyniki egzaminu ósmoklasisty. Zainteresowani mogą złożyć wniosek o wgląd do pracy egzaminacyjnej. Niezadowoleni z wyników mogą zwrócić się o weryfikację sumy punktów.

pokaż więcej
Proszę czekać...