
Na stronie wydawnictwa Springer została opublikowana praca autorstwa naszych naukowców na temat analizy wydźwięku artykułów Wikipedii o firmach z wykorzystaniem różnych modeli sztucznej inteligencji. Celem badań było sprawdzenie, jak różne modele radzą sobie z oceną wydźwięku długich tekstów charakterystycznych dla Wikipedii, a także jak wydźwięk różni się w zależności od branży oraz jakości artykułów.
Wikipedia stanowi jedno z popularnych źródeł informacji na różne tematy. Ze względu na swoją otwartą strukturę edycyjną, zapewnienie neutralnego punktu widzenia (ang. Neutral Point of View, NPOV) w artykułach może stanowić istotne wyzwanie. Jedną z metod oceny neutralności artykułów jest analiza wydźwięku, czyli ocena nacechowania emocjonalnego treści.
W ramach publikacji pt. „Sentiment Analysis of Wikipedia Articles About Companies: A Comparison of Different Models” została przeprowadzona analiza porównawcza różnych modeli analizy wydźwięku – zarówno tych opartych na słownikach (TextBlob, VADER), jak i bardziej zaawansowanych modeli opartych na transformerach (RoBERTa, DistilBERT oraz PySentimiento). Autorzy publikacji: dr Milena Stróżyna, dr Włodzimierz Lewoniewski, mgr Izabela Czumałowska, mgr inż. Aleksandra Wojewoda.
W ramach badania przeprowadzono szczegółowy proces selekcji artykułów, ich wstępnego przetwarzania oraz zaproponowano trzy różne metody agregacji wyników analizy wydźwięku. Wyniki pokazały, że ocena w dużym stopniu zależy zarówno od zastosowanego modelu, jak i specyfiki branży, do której należy opisywana firma. Uzyskane wyniki mogą dostarczyć praktyczne wskazówki dla badaczy oraz praktyków zainteresowanych analizą wydźwięku, szczególnie w odniesieniu do długich tekstów, takich jak artykuły Wikipedii. Badanie to stanowi wkład w lepsze zrozumienie możliwości i ograniczeń różnych modeli do analizy wydźwięku.