Wykorzystanie indeksu cytowań oraz syntetycznej miary jakości do porównania wersji językowych Wikipedii

Praca naukowa przygotowana przez zespół badaczy z naszej Katedry została zaprezentowana na konferencji Wiki Workshop 2025. Badanie skupia się na kompleksowej analizie artykułów Wikipedii z 55 wersji językowych Wikipedii z podziałem na tematy. W ramach pracy zastosowano autorskie podejście oparte o indeks cytowań oraz syntetyczną miarę jakości artykułów.

W ramach pracy został opracowany indeks cytowań na podstawie analizy 6,6 miliarda odnośników między stronami Wikipedii, dzięki czemu możliwe było wskazanie najważniejszych artykułów w ramach poszczególnych wersji językowych. Dodatkowo, artykuły zostały podzielone na 18 kategorii tematycznych przy wykorzystaniu otwartej semantycznej bazy wiedzy Wikidane, co pozwoliło dodatkowo znaleźć najbardziej cytowane artykuły w poszczególnych tematach. Każdy z ponad 47 milionów artykułów został oceniony pod kątem jakości z wykorzystaniem miary syntetycznej, która pozwala na porównanie jakości artykułów nawet pomiędzy różnymi wersjami językowymi, gdzie mogą być stosowane odmienne standardy jakości.

Nagranie z prezentacji:

Wyniki badania wyraźnie pokazały różnice między poszczególnymi wersjami językowymi Wikipedii w różnych tematach. Praca otwiera drogę do dalszych badań nad jakością wielojęzycznych treści Wikipedii oraz może wspomóc ukierunkowane działania społeczności Wikipedii na rzecz poprawy jakości treści w mniej rozwiniętych wersjach językowych.

Praca pt. „Utilizing citation index and synthetic quality measure to compare Wikipedia languages across various topics” została opublikowana w otwartym dostępie. Autorzy publikacji: dr Włodzimierz Lewoniewski, dr hab. Krzysztof Węcel, prof. UEP, prof. dr hab. Witold Abramowicz. Dodatkowo, zostały opublikowane w otwartym dostępie zbiory danych zawierające obliczone indeksy cytowań dla artykułów Wikipedii na platformie Hugging Face oraz oceny jakości artykułów na platformie Kaggle.

Wiki Workshop to coroczna międzynarodowa konferencja naukowa organizowana przez środowiska akademickie i ekspertów zajmujących się badaniami nad Wikipedią oraz innymi projektami fundacji Wikimedia. Celem wydarzenia jest wymiana wiedzy, doświadczeń oraz wyników badań, które mogą wspierać dalszy rozwój Wikipedii i poprawę jakości publikowanych treści. Tegoroczna edycja konferencji odbyła się w dniach 21-22 maja w formie zdalnej. Więcej informacji można znaleźć na stronie Wiki Workshop: wikiworkshop.prg