REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć

ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
ChatGPT-4 zdał egzamin z radiologii ale wg naukowców lepiej mu nie wierzyć
Shutterstock

REKLAMA

REKLAMA

Najnowsza wersja ChatGPT potrafi interpretować wyniki medycznych badań obrazowych na tyle dobrze, że zdała egzamin na lekarza radiologa; ma jednak nadal pewne widoczne wady, ograniczające wiarygodność tak postawionych diagnoz – informuje pismo „Radiology”.

Czym jest ChatGPT?

ChatGPT to chatbot wykorzystujący sztuczną inteligencję (AI). Dzięki modelowi głębokiego uczenia się rozpoznaje wzorce i relacje między słowami w ogromnych zbiorach danych w celu generowania odpowiedzi podobnych do ludzkich. Bywa jednak, że jego odpowiedzi nie są zgodne ze stanem rzeczywistym.

„Wykorzystanie dużych modeli językowych, takich jak ChatGPT, rośnie i będzie rosło — powiedział główny autor, dr Rajesh Bhayana, radiolog z University Medical Imaging w Toronto (Kanada). - Nasze badania dają wgląd w możliwości ChatuGPT w kontekście radiologii, podkreślając niesamowity potencjał dużych modeli językowych, wraz z obecnymi ograniczeniami, które czynią go niewiarygodnym”.

Jak zaznaczył dr Bhayana, ChatGPT został niedawno uznany za najszybciej rozwijającą się aplikację konsumencką w historii, a podobne chatboty są włączane do popularnych wyszukiwarek, takich jak Google i Bing, których lekarze i pacjenci używają szukając informacji medycznych.

REKLAMA

ChatGPT 3.5 a egzamin z radiologii

Aby ocenić skuteczność AI w zdawaniu egzaminu na radiologa oraz zbadać mocne i słabe strony, dr Bhayana i współpracownicy najpierw przetestowali ChatGPT w oparciu o GPT-3.5, obecnie najczęściej używaną wersję, stosując treść i poziom trudności egzaminów Canadian Royal College i American Board of Radiology

Pytania nie zawierały obrazów i zostały tak pogrupowane, aby ocenić prostsze (przywoływanie wiedzy, podstawowe zrozumienie) i bardziej złożone czynności myślowe (zastosowanie, analiza, synteza). W przypadku tych bardziej złożonych oceniano z kolei opisywanie znalezionych cech obrazu, postepowanie kliniczne, klasyfikację oraz powiązania chorób.

Działanie ChatuGPT oceniono ogólnie oraz według rodzaju i tematu pytania.

Naukowcy odkryli, że ChatGPT oparty na GPT-3.5 odpowiedział poprawnie na 69 proc. pytań (104 ze 150), blisko pozytywnej oceny 70 proc. stosowanej przez Royal College w Kanadzie; miał jednak trudności z pytaniami dotyczącymi: myślenia wyższego rzędu (60 proc; 53 z 89), kalkulacji i klasyfikacji (25 proc., 2 z 8) oraz stosowania pojęć (30 proc., 3 z 10). Jego słabe wyniki w pytaniach dotyczących myślenia wyższego rzędu nie były zaskakujące biorąc pod uwagę brak wstępnego szkolenia w zakresie radiologii.

GPT-4 zdał egzamin

W kolejnym badaniu udostępniony w marcu 2023 jako płatna usługa GPT-4 odpowiedział poprawnie na 81 proc. (121 ze 150) tych samych pytań, przewyższając GPT-3.5 i przekraczając próg zaliczenia wynoszący 70 proc. GPT-4 działał znacznie lepiej niż GPT-3.5 w przypadku bardziej skomplikowanych intelektualnie czynności, zwłaszcza gdy chodziło o opisy wyników badań obrazowych (85 proc.) i stosowanie pojęć (90 proc.).

Wyniki sugerują, że ulepszone zaawansowane możliwości rozumowania GPT-4 przekładają się na lepszą wydajność w kontekście radiologicznym.

„Nasze badanie pokazuje imponującą poprawę wydajności ChatuGPT w radiologii w krótkim okresie, podkreślając rosnący potencjał dużych modeli językowych w tym kontekście” – powiedział dr Bhayana.

Ważne

GPT-4 nie wykazał poprawy w przypadku pytań dotyczących czynności umysłowych niższego rzędu (80 proc. vs 84 proc.) i odpowiedział niepoprawnie na 12 pytań, na które GPT-3.5 odpowiedział poprawnie, co rodzi pytania dotyczące jego wiarygodności w zakresie gromadzenia informacji.

Chat GPT potrafi konsekwentnie i pewnie udzielać błędnych odpowiedzi

„Początkowo byliśmy zaskoczeni dokładnymi i pewnymi odpowiedziami ChatuGPT na niektóre trudne pytania radiologiczne, ale potem równie zaskoczeni niektórymi bardzo nielogicznymi i niedokładnymi twierdzeniami” – powiedział dr Bhayana.

Co prawda niebezpieczna tendencja ChatuGPT do generowania niedokładnych odpowiedzi (zwanych „halucynacjami”) jest rzadsza w wersji GPT-4, nadal jednak ogranicza jego użyteczność w edukacji medycznej i praktyce klinicznej.

Oba badania wykazały, że ChatGPT konsekwentnie wypowiadał się w sposób wskazujący, że jest czegoś pewien, nawet jeśli nie miał racji.

"Dla mnie jest to jego największe ograniczenie. Obecnie ChatGPT najlepiej nadaje się do pobudzania pomysłów, pomagania w rozpoczęciu procesu pisania medycznego i podsumowywania danych. Jeśli jest używany do szybkiego przywoływania informacji, zawsze musi być zweryfikowany" – zaznaczył dr Bhajana.
(PAP)
Autor: Paweł Wernicki
pmw/ bar/

 

Autopromocja

REKLAMA

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code
Wynagrodzenie minimalne 2023 [quiz]
certificate
Jak zdobyć Certyfikat:
  • Czytaj artykuły
  • Rozwiązuj testy
  • Zdobądź certyfikat
1/15
Kiedy będą miały miejsce podwyżki minimalnego wynagrodzenia w 2023 roku?
od 1 stycznia i od 1 lipca
od 1 stycznia i od 1 czerwca
od 1 lutego i od 1 lipca
Następne
Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Profesor z SGH: równy wiek emerytalny dla kobiet i mężczyzn w Polsce to absolutna konieczność; minimum 65 lat. Większość państw Europy to już rozumie

Jaki wpływ zmiany demograficzne wywrą na życie Polaków, tłumaczy w rozmowie z PAP dyrektorka Instytutu Statystyki i Demografii Szkoły Głównej Handlowej prof. Agnieszka Chłoń-Domińczak. Jej zdaniem zrównanie wieku emerytalnego kobiet i mężczyzn, rozwój sztucznej inteligencji i praca cudzoziemców mogą pomóc w utrzymaniu stabilnego rynku pracy.

Nie będzie Centralnej Informacji Emerytalnej

Nie będzie Centralnej Informacji Emerytalnej (CIE). Zdaniem resortu cyfryzacji, CIE nie przyniesie oczekiwanych korzyści. Jest projekt ustawy. Czy brak CIE zmieni stan bieżący w zakresie informacji emerytalnej?

Renta wdowia – ile wynosi [obliczenia]. Różne przykłady świadczeń w zbiegu

W dniu 1 stycznia 2025 roku wejdą w życie nowe przepisy ustawy o emeryturach i rentach z Funduszu Ubezpieczeń Społecznych, które dadzą prawo do tzw. renty wdowiej.  Chodzi o możliwość łączenia wypłaty renty rodzinnej (nie tylko tej wypłacanej przez ZUS) z innym świadczeniem wypłacanym przez ZUS, np. emeryturą, rentą. Od tego dnia będzie można składać wnioski o to świadczenie ale wypłata nastąpi najwcześniej od 1 lipca przyszłego roku. Ile wyniesie renta wdowia i jak oblicza to świadczenie ZUS?

Renta wdowia od A do Z: limit, wysokość, warunki, wniosek, terminy, przepisy, zasady

Z początkiem 2025 roku wejdą w życie nowe przepisy ustawy o emeryturach i rentach z Funduszu Ubezpieczeń Społecznych, które dadzą prawo do tzw. renty wdowiej. Chodzi o możliwość łączenia wypłaty renty rodzinnej (nie tylko tej wypłacanej przez ZUS) z innym świadczeniem wypłacanym przez ZUS, np. emeryturą, rentą. Ile wyniesie renta wdowia i jak oblicza to świadczenie ZUS?

REKLAMA

Szokuje liczba rannych. 200 osób w tym 40 z zagrożeniem życia. Magdeburg o ofiarach ataku na jarmarku bożonarodzeniowym

Do zamachu doszło kilka minut po godzinie 19. Napastnik wjechał w tłum ludzi, którzy przyszli na jarmark bożonarodzeniowy. Według lokalnej policji funkcjonariuszom udało się zatrzymać napastnika. Na miejsce tragedii udał się premier rządu Saksonii-Anhalt, Reiner Haseloff. W nocy były sprzeczne informacje o liczbie zabitych - od 2 do 11. Po weryfikacji nocnych informacji są już dostępne informacje bliższe rzeczywistości. W artykule prezentujemy depesze agencyjne za okres ostatnich kilkudziesięciu godzin. Artykuł aktualizujemy na bieżąco.

Więcej podatników skorzysta ze zwolnienia od VAT ze względu na wysokość obrotów. Już od 1 stycznia 2025 roku. W życie wchodzą nowe przepisy

Od 1 stycznia 2025 r. większa grupa podatników będzie mogła skorzystać ze zwolnienia od VAT z uwagi na wysokość obrotów. Aby z niego skorzystać, nie trzeba będzie składać formularza rejestracyjnego. Wystarczy odpowiedni numer identyfikacyjny.

10 dni płatnego urlopu za staż pracy. Naprzemiennie. 36 dni urlopu. Potem 26 dni. I znów 36 dni urlopu. Za 10 lat pracy. Będzie nowelizacja?

To propozycja przywileju, ale tylko dla jednej grupy zawodowej. Dla asystentów rodziny. Oprócz bonusu urlopowego jest jeszcze dodatek terenowy i korzystny ryczałt. Propozycja tych przywilejów – w trybie petycji (patrz koniec artykułu) – trafiła do rządu. Powinna być załatwiona pozytywnie albo negatywnie do połowy lutego 2025 r. W przypadku "Tak" nowe przepisy powinny stać się obowiązującym prawem w 2026 r. Wtedy po raz pierwszy asystenci mieliby 36 dni urlopu wypoczynkowego.

Granice swobody umów. Przepisy, orzecznictwo

Jest wiele różnych rodzajów umów w polskim prawie. To strony zawierające umowę decydują o jej treści. Niemniej jednak kształtując konkretną treść postanowień umownych muszą one przestrzegać pewnych zasad ich tworzenia. Nie mogą także przekroczyć określonych granic.

REKLAMA

Zniesławienie i zniewaga. Gdzie kończy się krytyka, a zaczyna przestępstwo?

Obraźliwe słowa wypowiedziane z pełną premedytacją, ale i te rzucone w skrajnych emocjach czy pomówienia szeptane za plecami lub publikowane w komentarzach w sieci – to wszystko może nieść za sobą poważne konsekwencje prawne. Zniewaga i zniesławienie dotykają obecnie coraz więcej osób, zarówno w codziennych relacjach, jak i w wirtualnym świecie. Internet dodatkowo podsyca te zjawiska, zamieniając wymianę poglądów w lawinę hejtu, a pozorna anonimowość użytkowników dodatkowo wzmacnia poczucie bezkarności. Zniewaga i zniesławienie, choć przez wielu używane zamienienie, to w rzeczywistość dwa różne zjawiska. Czym się różnią i jakie kary grożą za obraźliwe słowa? Wyjaśnia to adwokat Dawid Jakubiec z Kancelarii Kupilas&Krupa w Bielsku-Białej, który tłumaczy także, gdzie kończy się wolność słowa, a zaczyna odpowiedzialność karna.

Od 3 stycznia 2025 r. inne terminy na złożenie wniosku "Aktywnie w żłobku". ZUS wypłacił ponad 151,2 tys. świadczeń "Aktywnie w żłobku" na 214,4 mln zł

Od 3 stycznia 2025 r. inne terminy na złożenie wniosku "Aktywnie w żłobku". ZUS wypłacił ponad 151,2 tys. świadczeń "Aktywnie w żłobku" na 214,4 mln zł. Kolejne wypłaty z programu "Aktywny Rodzic" jeszcze w grudniu.

REKLAMA