Wystąpienie na konferencji IJCAI 2025

Podczas międzynarodowej konferencji naukowej IJCAI 2025 (34th International Joint Conference on Artificial Intelligence) została przedstawiona praca autorstwa naszych naukowców dotycząca automatycznej analizy neutralności treści w Wikipedii. Wydarzenie miało miejsce w dniach 16-22 sierpnia 2025 roku w Montrealu (Kanada).

Wikipedia, jako jedno z najczęściej wykorzystywanych źródeł wiedzy w Internecie, odgrywa kluczową rolę w kształtowaniu opinii i dostarczaniu informacji milionom użytkowników na całym świecie. Dlatego zapewnienie jej jakości ma fundamentalne znaczenie. Jednym z najważniejszych kryteriów jakości jest zasada Neutralnego Punktu Widzenia (ang. Neutral point of view, NPOV), zgodnie z którą treści powinny być przedstawiane obiektywnie, bez osobistych uprzedzeń i opinii, z uwzględnieniem wszystkich istotnych punktów widzenia. Utrzymanie tej zasady stanowi jednak poważne wyzwanie ze względu na otwarty charakter edycji Wikipedii, do której redaktorzy mogą nieświadomie przenosić własne uprzedzenia. Z tego powodu niezwykle istotne staje się opracowanie metod umożliwiających automatyczne monitorowanie przestrzegania NPOV.

Analiza wydźwięku, powszechnie stosowana do oceny opinii w mediach społecznościowych, recenzjach czy komentarzach, daje możliwość klasyfikacji treści jako pozytywnej, neutralnej bądź negatywnej. Nowoczesne modele oparte na tej technice osiągają wysoką skuteczność, jednak są zwykle projektowane z myślą o krótkich, nieformalnych tekstach. Tymczasem artykuły Wikipedii cechują się większą długością i bardziej sformalizowaną strukturą, co ogranicza bezpośrednie zastosowanie takich narzędzi. Wymaga to zatem opracowania zaawansowanych metodologii pozwalających na skuteczne zastosowanie analizy wydźwięku do dłuższych i bardziej złożonych treści.

W ramach przedstawionej pracy pt. „Cross-Topic Sentiment Analysis of Wikipedia Articles: A Comparative Study of AI Models” nasi naukowcy przeanalizowali niemal 7 milionów artykułów z anglojęzycznej Wikipedii, stosując cztery modele do analizy wydźwięku – oparte na słownikach (TextBlob, VADER) oraz transformatorach (RoBERTa, DistilBERT). Wyniki badań pokazały jak wydźwięk artykułów Wikipedii różni się w zależności od tematyki treści. Dodatkowo praca wykazała różnice pomiędzy wynikami każdego z modeli do analizy wydźwięku. W ramach pracy udostępniono również zbiór danych na platformie Hugging Face zawierający ocenę wydźwięku artykułów Wikipedii uzyskaną za pomocą zastosowanych modeli.

Praca proponuje nowe podejście do automatycznej oceny neutralności treści Wikipedii – jednego z najważniejszych i najczęściej używanych źródeł wiedzy w Internecie. W odróżnieniu od wcześniejszych badań, które koncentrowały się na krótkich tekstach lub wąskich grupach artykułów, autorzy analizują całość anglojęzycznej Wikipedii, wykorzystując zaawansowane modele analizy wydźwięku. Dzięki temu powstaje praktyczne narzędzie umożliwiające systematyczne monitorowanie przestrzegania zasady Neutralnego Punktu Widzenia. Dodatkowo zaproponowana metodologia może znaleźć zastosowanie w ocenie jakości i wiarygodności innych zasobów wiedzy online. Autorzy pracy: dr Włodzimierz Lewoniewski, dr Milena Stróżyna, mgr Izabela Czumałowska, mgr inż. Aleksandra Wojewoda, dr hab. Krzysztof Węcel, prof. UEP.