
Na Uniwersytecie Ekonomicznym w Poznaniu odbyło się siódme seminarium AI Transformations pt. „PLLuM – polski otwarty duży model językowy jako narzędzie w eksploracji baz wiedzy”. Prelegentem był prof. dr hab. inż. Maciej Piasecki z Katedry Sztucznej Inteligencji Politechniki Wrocławskiej, który jest koordynatorem projektu PLLuM (Polish Large Language Model), budującego polski duży model językowy. Profesor zaprezentował kulisy powstawania w pełni otwartego modelu językowego wytrenowanego na dużej liczbie tekstów w języku polskim oraz jego praktyczne zastosowania – od wirtualnego asystenta petenta dla instytucji publicznych po narzędzia wspierające badania naukowe.
Nagranie z seminarium:
PLLuM – rodzina modeli, które mogą być wykorzystane do różnych celów, takich jak na przykład: podsumowywanie wielostronicowych raportów, odpowiadanie na pytania w języku naturalnym, generowanie propozycji pism urzędowych czy nawet automatyczne tagowanie zbiorów archiwalnych. Co ważne, PLLuM można również dostroić (fine-tune) do specyfiki danej branży: od medycyny przez bankowość po administrację publiczną. To może dać badaczom i firmom tanie w utrzymaniu, a zarazem elastyczne narzędzie, które rozumie kontekst kulturowy, idiomy i skróty myślowe charakterystyczne dla języka polskiego.
Otwarty, wyspecjalizowany model językowy może pozwolić zespołom naukowym wdrażać zaawansowane możliwości przetwarzania języka naturalnego – od ekstrakcji faktów i klasyfikacji treści po semantyczne wyszukiwanie – bez kosztownego trenowania własnych modeli językowych od podstaw. Udostępnienie takich modeli językowych może mieć pozytywny wpływ na rozwój różnych projektów, w których istotnym elementem jest analiza tekstów w języku polskim. Na przykład, w ramach projektu OpenFact, który jest realizowany przez zespół z Katedry Informatyki Ekonomicznej, duże modele językowe mogą wesprzeć proces weryfikacji wiarygodności źródeł informacji w internecie oraz detekcji fałszywych informacji.
Prof. dr hab. inż. Maciej Piasecki: krótko o projekcie PLLuM:
Prof. dr hab. inż. Maciej Piasecki zajmuje się przetwarzaniem języka naturalnego, lingwistyką komputerową, leksykografią i humanistyką cyfrową. Jest koordynatorem oraz jednym ze współzałożycieli CLARIN-PL, polskiej części europejskiej infrastruktury badawczej technologii językowych CLARIN ERIC dla nauk humanistycznych i społecznych. CLARIN-PL wspiera naukowców zasobami i narzędziami językowymi, a także aplikacjami badawczymi i infrastrukturą obliczeniową promując jednocześnie otwartą naukę. Maciej Piasecki jest również
Seminarium odbyło się w dniu 9 maja 2025 roku w formule hybrydowej. Więcej informacji na temat PLLuM można znaleźć na stronie internetowej: pllum.org.pl