Na stronie wydawnictwa Elsevier została opublikowana praca naukowa na temat automatycznej identyfikacji istotnych źródeł informacji na określony temat w wielojęzycznej Wikipedii na podstawie analizy ponad 230 milionów przypisów. W ramach tej publikacji zostały przedstawione różne modele automatycznej oceny źródeł informacji, które uwzględniają częstotliwość występowania badanych źródeł, popularność treści ze strony czytelników oraz edytorów Wikipedii.
Artykuły Wikipedii zostały podzielone na 70 tematów o różnym poziomie abstrakcji, które dotyczą takich obszarów jak: kultura, geografia, historia, społeczeństwo, nauka, technologia, inżynieria i matematyka. Dysponując informacją o przypisach wydobytych z poszczególnych artykułów Wikipedii, można zbadać, na ile dobrze poszczególne tematy Wikipedii oferują weryfikowalne informacje w różnych wersjach językowych Wikipedii. Poniższy rysunek przedstawia wartości dotyczące gęstości referencji dla każdego z 70 tematów oraz 42 wersji językowych Wikipedii.
Dodatkowo w ramach badań zostały zidentyfikowane naukowe źródła informacji, co pozwoliło na określenie różnic pomiędzy wersjami językowymi pod kontem wartości wskaźnika Sci. Na przykład, w najbardziej rozbudowanej anglojęzycznej wersji Wikipedii udział naukowych źródeł informacji wynosi około 2,6%, w wersji polskojęzycznej – 0,76%.
Wyniki badań naukowych zostały przedstawione podczas konferencji KES 2022. Publikacja jest dostępna pod adresem: doi.org/10.1016/j.procs.2022.09.387