
Podczas międzynarodowej konferencji naukowej IJCAI 2025 (34th International Joint Conference on Artificial Intelligence) została przedstawiona praca autorstwa naszych naukowców dotycząca automatycznej analizy neutralności treści w Wikipedii. Wydarzenie odbyło się w dniach 16-22 sierpnia w Montrealu (Kanada).
Wikipedia, jako jedno z najczęściej wykorzystywanych źródeł wiedzy w Internecie, odgrywa kluczową rolę w kształtowaniu opinii i dostarczaniu informacji milionom użytkowników na całym świecie. Dlatego zapewnienie jej jakości ma fundamentalne znaczenie. Jednym z najważniejszych kryteriów jakości jest zasada Neutralnego Punktu Widzenia (ang. Neutral point of view, NPOV), zgodnie z którą treści powinny być przedstawiane obiektywnie, bez osobistych uprzedzeń i opinii, z uwzględnieniem wszystkie istotnych punktów widzenia. Utrzymanie tej zasady stanowi jednak poważne wyzwanie ze względu na otwarty charakter edycji Wikipedii, w którym redaktorzy mogą wprowadzać własne uprzedzenia. Z tego powodu niezwykle istotne staje się opracowanie metod umożliwiających automatyczne monitorowanie przestrzegania NPOV.
Analiza wydźwięku, powszechnie stosowana do oceny opinii w mediach społecznościowych, recenzjach czy komentarzach, daje możliwość klasyfikacji treści jako pozytywnej, neutralnej bądź negatywnej. Nowoczesne modele oparte na tej technice osiągają wysoką skuteczność, jednak są zwykle projektowane z myślą o krótkich, nieformalnych tekstach. Tymczasem artykuły Wikipedii cechują się większą długością i bardziej sformalizowaną strukturą, co ogranicza bezpośrednie zastosowanie takich narzędzi. Wymaga to zatem opracowania zaawansowanych metodologii pozwalających na skuteczne zastosowanie analizy sentymentu do dłuższych i bardziej złożonych treści.
W ramach przedstawionej pracy pt. „Cross-Topic Sentiment Analysis of Wikipedia Articles: A Comparative Study of AI Models” nasi naukowcy przeanalizowali niemal 7 milionów artykułów z anglojęzycznej Wikipedii, stosując cztery modele do analizy wydźwięku – oparte na słownikach (TextBlob, VADER) oraz transformatorach (RoBERTa, DistilBERT). Wyniki badań pokazały jak wydźwięk artykułów Wikipedii różni się w zależności od tematyki treści. Dodatkowo praca wykazała różnice pomiędzy wynikami każdego z modeli do analizy wydźwięku. W ramach pracy udostępniono również zbiór danych zawierający ocenę wydźwięku artykułów Wikipedii uzyskaną za pomocą zastosowanych modeli, opublikowany na platformie Hugging Face.
Praca proponuje nowe podejście do automatycznej oceny neutralności treści Wikipedii – jednego z najważniejszych i najczęściej używanych źródeł wiedzy w Internecie. W odróżnieniu od wcześniejszych badań, które koncentrowały się na krótkich tekstach lub wąskich grupach artykułów, autorzy analizują całość anglojęzycznej Wikipedii, wykorzystując zaawansowane modele analizy wydźwięku. Dzięki temu powstaje praktyczne narzędzie umożliwiające systematyczne monitorowanie przestrzegania zasady Neutralnego Punktu Widzenia (NPOV). Dodatkowo, zaproponowana metodologia może znaleźć zastosowanie w ocenie jakości i wiarygodności innych zasobów wiedzy online. Autorzy pracy: dr Włodzimierz Lewoniewski, dr Milena Stróżyna, mgr Izabela Czumałowska, mgr inż. Aleksandra Wojewoda, dr hab. Krzysztof Węcel, prof. UEP.