PLLuM – polski otwarty duży model językowy jako narzędzie w eksploracji baz wiedzy (wideo)

Na Uniwersytecie Ekonomicznym w Poznaniu odbyło się siódme seminarium AI Transformations pt. „PLLuM – polski otwarty duży model językowy jako narzędzie w eksploracji baz wiedzy”. Prelegentem był prof. dr hab. inż. Maciej Piasecki z Katedry Sztucznej Inteligencji Politechniki Wrocławskiej, który jest koordynatorem projektu PLLuM (Polish Large Language Model), budującego polski duży model językowy. Profesor zaprezentował kulisy powstawania w pełni otwartego modelu językowego wytrenowanego na dużej liczbie tekstów w języku polskim oraz jego praktyczne zastosowania – od wirtualnego asystenta petenta dla instytucji publicznych po narzędzia wspierające badania naukowe.

Nagranie z seminarium:

PLLuM – rodzina modeli, które mogą być wykorzystane do różnych celów, takich jak na przykład: podsumowywanie wielostronicowych raportów, odpowiadanie na pytania w języku naturalnym, generowanie propozycji pism urzędowych czy nawet automatyczne tagowanie zbiorów archiwalnych. Co ważne, PLLuM można również dostroić (fine-tune) do specyfiki danej branży: od medycyny przez bankowość po administrację publiczną. To może dać badaczom i firmom tanie w utrzymaniu, a zarazem elastyczne narzędzie, które rozumie kontekst kulturowy, idiomy i skróty myślowe charakterystyczne dla języka polskiego.

Otwarty, wyspecjalizowany model językowy może pozwolić zespołom naukowym wdrażać zaawansowane możliwości przetwarzania języka naturalnego – od ekstrakcji faktów i klasyfikacji treści po semantyczne wyszukiwanie – bez kosztownego trenowania własnych modeli językowych od podstaw. Udostępnienie takich modeli językowych może mieć pozytywny wpływ na rozwój różnych projektów, w których istotnym elementem jest analiza tekstów w języku polskim. Na przykład, w ramach projektu OpenFact, który jest realizowany przez zespół z Katedry Informatyki Ekonomicznej, duże modele językowe mogą wesprzeć proces weryfikacji wiarygodności źródeł informacji w internecie oraz detekcji fałszywych informacji.

Prof. dr hab. inż. Maciej Piasecki: krótko o projekcie PLLuM:

Prof. dr hab. inż. Maciej Piasecki zajmuje się przetwarzaniem języka naturalnego, lingwistyką komputerową, leksykografią i humanistyką cyfrową. Jest koordynatorem oraz jednym ze współzałożycieli CLARIN-PL, polskiej części europejskiej infrastruktury badawczej technologii językowych CLARIN ERIC dla nauk humanistycznych i społecznych. CLARIN-PL wspiera naukowców zasobami i narzędziami językowymi, a także aplikacjami badawczymi i infrastrukturą obliczeniową promując jednocześnie otwartą naukę. Maciej Piasecki jest również

Seminarium odbyło się w dniu 9 maja 2025 roku w formule hybrydowej. Więcej informacji na temat PLLuM można znaleźć na stronie internetowej: pllum.org.pl

P	W	Ś	C	P	S	N
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30