Firmy w wielojęzycznej Wikipedii: jakość artykułów oraz ważne źródła informacji

Praca naukowa pracowników naszej Katedry została opublikowana w monografii „Information Technology for Management: Approaches to Improving Business and Society” wydanej przez wydawnictwo Springer. Badania dotyczą automatycznej oceny jakości artykułów Wikipedii oraz wiarygodności źródeł informacji na temat firm w różnych językach.

W ramach tej pracy zostało zidentyfikowano ponad pół miliona artykułów Wikipedii dotyczących firm w 310 wersjach językowych. W tym celu zostały wykorzystane dane z DBpedii oraz Wikidanych. Następnie została przeprowadzona ekstrakcja i analiza przypisów zawartych w tych artykułach pod kątem istotnych źródeł informacji. Przy tym zostały wykorzystane trzy różne modeli oceny źródeł. To pozwoliło na sporządzenie rankingu najbardziej istotnych źródeł informacji na temat firm dla każdej wersji językowej Wikipedii.

Publikacja pt. „Companies in Multilingual Wikipedia: Articles Quality and Important Sources of Information” jest dostępna na stronie wydawnictwa Springer. Autorzy publikacji: Włodzimierz Lewoniewski, Krzysztof Węcel, Witold Abramowicz.

Jakość artykułów Wikipedii oraz źródła informacji

Otwarty charakter Wikipedii umożliwia każdemu dodanie i edycję treści. To ma swoje wady i zalety. Do zalet można odnieść możliwość szybkiego edytowania artykułów, dzięki czemu Wikipedia jest w stanie szybko reagować na aktualne wydarzenia i zapewnić informacje na temat nowych tematów niemal natychmiast po ich pojawieniu się. Wolna edycja umożliwia tworzenie artykułów na różne tematy, również te, które mogą nie zostać uwzględnione w tradycyjnych encyklopediach. Jednak ze względu na otwartą naturę Wikipedii, istnieje ryzyko, że niektóre informacje mogą być nieprawdziwe, stronnicze lub wprowadzające w błąd. Dodatkowo, jakość artykułów na Wikipedii może się znacznie różnić. Niektóre są dobrze napisane, oparte na wiarygodnych źródłach, podczas gdy inne mogą być niekompletne, nieaktualne, subiektywne czy źle sformułowane. Dlatego ocena jakości informacji oraz weryfikacja źródeł informacji jest tak istotna.

Sprawdzanie i ocena jakości informacji wraz z oceną źródeł nie tylko może pomóc w utrzymaniu wysokiej jakości treści na Wikipedii, ale może być również kluczowe dla firm, które chcą skutecznie zarządzać swoim wizerunkiem i relacjami publicznymi. Podejście zaprezentowane w publikacji może również pomóc redaktorom-wolontariuszom Wikipedii w wyborze artykułów, które należy dopracować. Dodatkowo przedstawione modele oceny wiarygodności źródeł mogą wskazać serwisy internetowe, które dostarczają cenne informacje o firmach.

DBpedia oraz Wikidane

Semantyczne bazy danych, takie jak Wikidane i DBpedia, zapewniają szeroki zakres możliwości, szczególnie dla osób zajmujących się analizą danych, badaniami naukowymi, sztuczną inteligencją, oraz tworzeniem aplikacji bazujących na danych. Semantyczne bazy danych umożliwiają łatwe powiązanie danych z różnych źródeł. Dzięki temu można łatwo łączyć informacje z różnych domen i tworzyć nowe, bogate zestawienia danych. Dodatkowo, dzięki semantycznym relacjom pomiędzy danymi, te bazy danych są w stanie lepiej zrozumieć kontekst danych. Na przykład, jeżeli dwa obiekty są powiązane relacją „jest rodzicem”, baza danych „rozumie”, że istnieje pewien rodzaj relacji pomiędzy tymi obiektami.

DBpedia, Wikidane oraz inne semantyczne bazy są otwarte dla wszystkich i zawierają dane na różne tematy. Dzięki temu stanowią one niezwykle cenne źródło informacji dla badaczy i twórców aplikacji. Warto zaznaczyć, że semantyczne bazy danych są niezwykle użyteczne w dziedzinie sztucznej inteligencji, zwłaszcza w kontekście uczenia maszynowego i przetwarzania języka naturalnego. One mogą być wykorzystane do trenowania modeli, tworzenia systemów rekomendacji, rozpoznawania encji, odpowiadania na pytania, a nawet do tworzenia chatbotów.

OpenFact

Publikacja powstała w ramach projektu OpenFact, finansowanego przez Narodowe Centrum Badań i Rozwoju w ramach programu INFOSTRATEG I „Zaawansowane technologie informacyjne, telekomunikacyjne i mechatroniczne”.