Podczas międzynarodowej konferencji KES 2022 (26th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems) zostały przedstawione wyniki badań naukowych na temat identyfikacji ważnych źródeł informacji w różnych tematach oraz wersjach językowych Wikipedii. Tegoroczna edycja konferencji KES została zorganizowana w Weronie (Włochy) w trybie hybrydowym.
Artykuły w Wikipedii powinny opierać się na weryfikowalnych źródłach informacji. Jednak nie każda strona internetowa może występować jako źródło informacji w tej encyklopedii. Zgodnie z zasadami Wikipedii, informacje w artykułach tej encyklopedii powinny powstawać na bazie wiarygodnych, niezależnych, opublikowanych treści o dobrej reputacji w zakresie faktografii oraz dokładności. Jednak wiarygodność jest pojęciem subiektywnym, a reputację tego samego źródła można oceniać na podstawie różnych kryteriów w zależności od osoby (lub grupy osób). Zatem każda wersja językowa Wikipedii może mieć własne zasady lub kryteria dotyczące tego, jak witryna musi być oceniana, zanim będzie mogła zostać wykorzystana jako źródło w przypisach artykułu Wikipedii. W związku z tym, wiarygodność tego samego źródła w Wikipedii zależy od tematu i wersji językowej. Dodatkowo ocena wiarygodności (reputacji) może z czasem ulec zmianie.
Podczas prezentacji pt. „Identification of important web sources of information on Wikipedia across various topics and languages” dr Włodzimierz Lewoniewski przedstawił wyniki analizy ponad 230 milionów przypisów (referencji) w artykułach różnych wersji językowych Wikipedii. Na przykład, najbardziej rozwinięta Wikipedia anglojęzyczna zawiera ponad 70 milionów przypisów, wówczas wersja polskojęzyczna Wikipedii – ponad 7,5 mln przypisów do różnych źródeł informacji. Na podstawie metadanych przypisów zostały zidentyfikowane unikatowe witryny internetowe. W przypadku wersji angielskojęzycznej liczba takich stron internetowych przekroczyła 1,7 mln, wówczas dla wersji polskojęzycznej Wikipedii można znaleźć ponad 200 tysięcy unikatowych witryn internetowych.
Dodatkowo zostały zidentyfikowane przypisy do publikacji naukowych. To pozwoliło na otrzymanie wskaźnika „Sci”, który pokazuje częstotliwość występowania naukowych źródeł informacji w ramach rozpatrywanej wersji językowej Wikipedii. Następnie artykuły Wikipedii zostały podzielone na tematy i przy użyciu różnych modeli oceny wiarygodności źródeł, została przeprowadzona analiza porównawcza stron internetowych w różnych tematach oraz wersjach językowych.
Tegoroczna edycja konferencji KES odbyła się w dniach 7-9 września. Strona internetowa konferencji KES 2022: kes2022.kesinternational.org
Źródło ilustracji: commons.wikimedia.org