Modelowanie popularności i wiarygodności źródeł w wielojęzycznej Wikipedii

Jednym z najważniejszych czynników wpływających na jakość treści w Wikipedii jest obecność wiarygodnych źródeł. Poprzez referencje czytelnicy tej wolnej encyklopedii mogą zweryfikować fakty lub znaleźć więcej szczegółów na opisany temat. Artykuł w Wikipedii może być edytowany niezależnie w ponad 300 wersjach językowych, nawet przez anonimowych użytkowników. Dlatego informacje na ten sam temat mogą być niespójne. Dotyczy to również korzystania z referencji w różnych wersjach językowych danego artykułu, zatem to samo stwierdzenie może mieć różne źródła. W tym artykule zostało przeanalizowano ponad 40 milionów artykułów z 55 najbardziej rozwiniętych wersji językowych Wikipedii. To pozwoliło na wydobycie informacji o ponad 200 milionach referencji oraz znaleźć najbardziej popularne i wiarygodne źródła.

W ramach artykułu zostało przedstawiono 10 modeli oceny popularności i wiarygodności źródeł na podstawie analizy meta informacji o odniesieniach w artykułach Wikipedii, odsłonach stron i autorach artykułów. Korzystając z DBpedii oraz Wikidanych zostało przeprowadzone automatyczne dopasowanie źródeł do konkretnej domeny. Dodatkowo, zostały przeanalizowane zmiany popularności i wiarygodności w czasie oraz liderzy wzrostu w każdym z rozpatrywanych miesięcy. Wyniki mogą być wykorzystane do poprawy jakości treści w różnych wersjach językowych Wikipedii. Na przykład, do najpopularniejszych czasopism w referencjach anglojęzycznej Wikipedii należą: Nature, Astronomy and Astrophysics, Science, The Astrophysical Journal, Lloyd’s List, Monthly Notices of the Royal Astronomical Society, The Astronomical Journal oraz inne.

Autorzy publikacji: Włodzimierz Lewoniewski, Krzysztof Węcel, Witold Abramowicz.

Artykuł został opublikowany w czasopiśmie Information 2020, 11(5), 263. Niektóre wyniki są dostępne na portalu BestRef.