Automatyczna ocena jakości wizualizacji danych na przykładzie polskojęzycznej Wikipedii

Artykuł autorstwa naszych pracowników pt. „Quality Measures for Data Visualization: A Case Study of Polish Wikipedia” został opublikowany w otwartym dostępie. Praca jest poświęcona analizie jakości wizualizacji danych w polskojęzycznej Wikipedii. W badaniu wykorzystano obszerny zbiór obejmujący ponad milion artykułów, z którego wyodrębniono i sklasyfikowano elementy wizualne, takie jak tabele, wykresy, diagramy oraz mapy.

W ramach pracy zdefiniowano i zastosowano ponad 30 miar oceny jakości wizualizacji danych, obejmujących zarówno kryteria estetyczne, jak i funkcjonalne — od czytelności, przez poprawność prezentacji informacji, po zgodność z dobrymi praktykami projektowania. Badane treści zostały wzbogacone o dodatkowe metadane oraz etykiety semantyczne generowane przez model językowo-wizualny (multimodalny), co pozwoliło na bardziej kompletną ocenę poszczególnych wizualizacji. Każdą z wizualizacji przypisano do jednej z 22 tematycznych kategorii przy wykorzystaniu połączeń artykułów Wikipedii z elementami semantycznej bazy wiedzy Wikidane, co umożliwiło całościowe spojrzenie na strukturę i różnorodność graficznej warstwy Wikipedii.

Jest to pierwsze kompleksowe opracowanie dotyczące warstwy wizualnej Wikipedii. Wyniki mogą służyć jako cenne źródło wiedzy dla projektantów informacji, popularyzatorów nauki, badaczy humanistyki cyfrowej, a także twórców narzędzi wspierających jakość treści cyfrowych. Zaproponowana metodyka ma charakter uniwersalny i może być wykorzystana do oceny oraz monitorowania jakości wizualizacji nie tylko w innych wersjach językowych Wikipedii, lecz także w szerokiej gamie otwartych repozytoriów wiedzy, gdzie rola dobrze zaprojektowanych treści wizualnych jest kluczowa dla efektywnej komunikacji.

Praca została zaprezentowana podczas konferencji KES 2025. Autorzy publikacji: dr Szczepan Górtowski, dr Włodzimierz Lewoniewski.