REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Polska odpowiedź na ChatGPT: PLLuM - modele językowe AI wyspecjalizowane w języku polskim. Już można korzystać

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
PLLuM Chat - strona główna
PLLuM - modele językowe wyspecjalizowane w języku polskim już udostępnione. Lepsze od ChatGPT?
Źródło zewnętrzne

REKLAMA

REKLAMA

Staraliśmy się, by polskie modele językowe PLLuM były bezpieczne, dostosowane do języka polskiego i "wytrenowane" na legalnie pozyskanych danych — powiedział PAP dr hab. Szymon Łukasik z NASK, ośrodka zaangażowanego w prace nad opublikowanymi w lutym modelami AI.
rozwiń >

PLLuM - rodzina dużych polskich modeli językowych

PLLuM (Polish Large Language Universal Model) to rodzina dużych polskich modeli językowych. Tego typu programy sztucznej inteligencji (AI) umożliwiają generowanie tekstu oraz przetwarzanie języka naturalnego. Dzięki nim komunikacja z maszyną nie wymaga od użytkownika stosowania sztywnych kodów i mechanicznych poleceń, ale przypominać może dialog z człowiekiem.

W odróżnieniu od komercyjnych modeli LLM (takich jak ChatGPT, Claude czy Gemini), modele PLLuM wyspecjalizowane są w języku polskim, choć do ich trenowania używano również tekstów w innych językach słowiańskich, bałtyckich oraz oczywiście w języku angielskim.

"Model jest dostosowany do języka i kultury polskiej. Prace w ramach tego projektu wspierają zaś polskich ekspertów i rozwój kompetencji w dziedzinie sztucznej inteligencji" — wyjaśnił w rozmowie z PAP uczestnik projektu dr hab. Szymon Łukasik, prof. AGH i dyrektor Ośrodka Badań nad Bezpieczeństwem Sztucznej Inteligencji NASK. Ośrodek ten ma koordynować teraz prace nad dalszymi pracami i wdrożeniem modeli w prace administracji publicznej — w ramach działań konsorcjum HIVE.

Do doszkalania modeli wykorzystano największy w Polsce, bo liczący 40 tys. interakcji, zbiór zapytań, w tym około 3,5 tys. dłuższych dialogów między tutejszymi trenerami a maszyną. Dzięki tej mrówczej pracy tzw. anotatorów AI ma sobie lepiej radzić ze specyfiką polskiego języka i polskiej kultury.

REKLAMA

Bezpieczeństwo i etyka

Badacz tłumaczy, jak ważne były w ramach prac kwestie bezpieczeństwa i etycznego podejścia do budowy AI. "Filozofią przyświecającą budowie tego modelu było to, żeby kwestie zbierania danych były maksymalnie przejrzyste. Żebyśmy mieli pewność, na jakim polu modele zbudowane z ich użyciem można wykorzystać" — powiedział dr hab. Łukasik. Wskazał, że przedstawiciele projektu zawierali np. umowy z redakcjami i pozyskiwali oficjalne zgody na korzystanie z archiwów polskich tekstów.

PLLuM — jak zapewniają jego twórcy — powstaje zgodnie z krajowymi i unijnymi wytycznymi dotyczącymi sztucznej inteligencji. I uwzględnia aktualne standardy ochrony danych.

30 miliardów tokenów

Ekspert z NASK tłumaczy, że język polski jest językiem o niskich zasobach. A to znaczy, że danych, które można wykorzystać do budowy modeli, nie ma zbyt dużo. Modele PLLuM do użytku komercyjnego są trenowane na ok. 30 miliardach tokenów (token to kawałek przetwarzanego tekstu - np. słowo lub jego fragment); zaś modele do użytku niekomercyjnego – dla takiego celu zasobów jest znacznie więcej – były trenowane na około 150 miliardach.

Wykorzystanie w administracji państwowej

Modele PLLuM docelowo mają być używane w administracji państwowej, a to oznacza kolejne wyzwania związane z bezpieczeństwem. Twórcy projektu musieli zadbać o to, by model stawiał w swoich odpowiedziach granice i by nie padały tam jakieś nielegalne, nieprawdziwe lub kontrowersyjne treści.

PLLuM Chat i PLLuM dla programistów

Modele PLLuM udostępnione są bezpłatnie w formie czatu wszystkim zainteresowanym https://pllum.clarin-pl.eu/. Ministerstwo Cyfryzacji opublikowało też dotąd 18 otwartych wersji modelu PLLuM dla programistów https://huggingface.co/CYFRAGOVPL. Do dyspozycji wszystkich zainteresowanych są więc zarówno lekkie, ale mniej dokładne wersje modeli, które można ściągnąć na laptopa, jak i mocniejsze, ale wymagające wielu kart graficznych modele do bardziej zaawansowanych zastosowań - np. badawczych. W przypadku obu typów istnieje możliwość uruchomienia modeli na własnej infrastrukturze, bez konieczności przekazywania zapytań do podmiotów zewnętrznych.

Dalszy ciąg materiału pod wideo

Generatory - wyspecjalizowane modele RAG-owe

W ramach projektu powstały też generatory, czyli wyspecjalizowane modele RAG-owe (ang. Retrieval Augmented Generation). Dzięki takim modelom można np. przeszukiwać i analizować swoje lokalne bazy danych i tworzyć wirtualnych asystentów analizujących zbiory własnych dokumentów. Zespół PLLuM zbudował najmniejszy (8 mld parametrów) ale wiodący w rankingach dla polskiego języka generator tego typu.

PLLuM i HIVE

Dr Łukasik odniósł się też do zmiany nazwy projektu z PLLuM na HIVE. "Nasze modele nazywają się PLLuM, a ich rodzina będzie dalej rozwijana w ramach konsorcjum HIVE. Chcieliśmy w ten sposób nawiązać do idea współpracy wielu badaczy, inżynierów i instytucji, działających niczym pszczoły w jednym ekosystemie, wymieniając się wiedzą i zasobami (np. danymi, kodem, modelami). Natomiast być może kiedyś będziemy chcieli wypuścić jakąś nową rodzinę modeli - z nową nazwą. Rozmawiamy o tym z Ministerstwem Cyfryzacji" - wskazał dr Łukasik.

Ludwika Tomala (PAP)
lt/ zan/ ktl/

Zapisz się na newsletter
Najlepsze artykuły, najpoczytniejsze tematy, zmiany w prawie i porady. Skoncentrowana dawka wiadomości z różnych kategorii: prawo, księgowość, kadry, biznes, nieruchomości, pieniądze, edukacja. Zapisz się na nasz newsletter i bądź zawsze na czasie.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: PAP

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Prawo
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
ZNP: Nauczyciele chcą wynagrodzenia za emaile od rodziców, kartkówki i sprawdziany, przygotowywanie się do lekcji, rady pedagogiczne, zebrania, wycieczki [Nadgodziny]

Źródłem nadgodzin nauczyciela może być odpowiadanie na emaile od rodziców, sprawdzanie kartkówek, przygotowywanie się do lekcji, rady pedagogiczne, zebrania, wycieczki. A nawet czas dyżurowania na korytarzu w czasie przerwy.

W PFRON 10 punktów preferencyjnych dla osoby niepełnosprawnej (każdy stopień) za elektroniczny wniosek w SOW [Przykład]

Chyba niewiele osób niepełnosprawnych wie, że za złożenie pierwszy raz wniosku o dofinansowanie w PFRON otrzymają 10 punktów preferencyjnych, jeżeli złożą wniosek w formie elektronicznej. To udogodnienie dzisiaj ma coraz mniejsze znaczenie bo prawie wszystkie wnioski do PFRON są składane przy pomocy ePUAP i profilu zaufanego albo klasycznego podpisu elektronicznego. Niemniej wciąż są osoby, które mogą z niego skorzystać np. starając się o dopłatę 100 000 zł do samochodu. Przykład: w programie o dofinansowania do zakupu samochodu przez osoby niepełnosprawne (link na końcu artykułu) może wystąpić sytuacja, kiedy istotne jest kiedy został zgłoszony wniosek. I wygrywa wtedy wniosek z większą liczbą punktów.

1 metr kwadratowy mieszkania za średnią miesięczną pensję brutto. W tej kwestii bez zmian w Polsce od 60 lat

Dane NBP i GUS pokazują wyraźnie, że w największych miastach Polski za przeciętną pensję można kupić obecnie niecały metr kwadratowy mieszkania. Podobna relacja wynagrodzeń do cen mieszkań utrzymuje się już od blisko 60 lat. Nawet w czasach PRL miesięczna pensja pokrywała koszty budowy mniej więcej jednego metra kwadratowego mieszkania.

Kobiety w branży finansowo-księgowej: Wciąż za mało na szczycie. Co blokuje ich awans?

Choć kobiety stanowią większość w branży finansowo-księgowej, nadal rzadziej niż mężczyźni zajmują najwyższe stanowiska. W Międzynarodowy Dzień Kobiet AICPA & CIMA przypominają, że równość szans to wciąż wyzwanie. Najnowszy raport Hays Poland ujawnia, co hamuje kariery kobiet i jak można to zmienić.

REKLAMA

Urlop macierzyński 2025 – zmiany. Od 19 marca dodatkowy urlop dla rodziców wcześniaków i noworodków wymagających hospitalizacji

Już od 19 marca 2025 r. rodzice wcześniaków oraz noworodków, które po narodzinach będą wymagały hospitalizacji, zyskają prawo do dodatkowego urlopu macierzyńskiego – płatnego w wysokości zasiłku macierzyńskiego. Z uprawnienia tego będzie mogła skorzystać zarówno matka, jak i ojciec dziecka, jednak wyłącznie bezpośrednio po zakończeniu podstawowego urlopu macierzyńskiego. Świadczenie to będzie uzupełnieniem obecnie obowiązujących form wsparcia dla rodziców.

Spadek przyjęty niechcący - co dalej? Przepisy po zmianach

„W ciągu ostatnich miesięcy wiele podróżowałem i nie miałem wiedzy o toczącym się postępowaniu spadkowym. Niedawno dowiedziałem się, iż przyjąłem zadłużony spadek. Co to oznacza? Czy mogę jakoś się z tego wycofać?”– pyta Czytelnik.

Luka. WZON czy sąd? MOPS nie wiedzą, kiedy przestać płacić świadczenie pielęgnacyjne 3287 zł. Znowu kłopoty dla osób niepełnosprawnych [stopień znaczny]

Artykuł dotyczy sytuacji, gdy WZON stwierdza, że nie ma niepełnosprawności, a wcześniej była (i było świadczenie pielęgnacyjne. Luka w przepisach polega na tym, że nie wiemy, czy MOPS słusznie kończą wypłaty świadczenia pielęgnacyjnego (stare świadczenie) w momencie niekorzystnej decyzji WZON (wojewódzki zespół ds orzekania o niepełnosprawności). Czy jednak MOPS powinny poczekać na wyrok sądu w tej sprawie. Niepewność prawa jest niszcząca dla rodzin osób niepełnosprawnych. Jeżeli MOPS wstrzyma wypłaty świadczenia pielęgnacyjnego od razu po decyzji WZON, to rodzina osoby niepełnosprawnej traci dochód w postaci 3287 zł (miesięcznie). Jeżeli tych wypłat nie będzie dopiero od wyroku sądu, to rodzina ta będzie miała kłopot z koniecznością zwrotu np. rocznego świadczenia pielęgnacyjnego 39 444 zł (12 miesięcy x 3287 zł) do MOPS.

Jak dyscyplinować dłużnika? Windykacja we własnym zakresie czy z pomocą firmy windykacyjnej?

Niemal każda branża spotyka się z problemem opóźnionych płatności. W szczególności dotyczy to branży transportu, spedycji i logistyki. W sektorze TSL nieterminowe regulowanie zobowiązań stało się powszechną praktyką. Dlatego windykacja należności jest aktualnie kluczowym elementem zarządzania finansami przedsiębiorstw z tego sektora. W jaki sposób przeprowadzić ją na koszt dłużnika?

REKLAMA

Konsumentowi trzeba przypominać o ryzyku związanym ze spożyciem alkoholu

Kodeks Dobrych Praktyk Marketingowych i porozumienie dotyczące znaków ostrzegających na etykietach to inicjatywy samoregulacyjne polskiej branży winiarskiej, które mają na celu promowanie odpowiedzialnej konsumpcji wina. Konsumentowi trzeba przypominać o ryzyku związanym ze spożyciem alkoholu.

Zasiłek pogrzebowy waloryzowany ale rzadziej? Będzie waloryzowany jeżeli wskaźnik waloryzacji będzie wyższy niż 105

Trwają prace nad zwiększeniem zasiłku pogrzebowego. Pojawił się nowy projekt nowelizacji ustawy o emeryturach i rentach z Funduszu Ubezpieczeń Społecznych oraz niektórych innych ustaw. W projekcie tym wróciła także waloryzacja zasiłku pogrzebowego.

REKLAMA