{"id":975,"date":"2024-03-01T16:39:08","date_gmt":"2024-03-01T15:39:08","guid":{"rendered":"https:\/\/kie.ue.poznan.pl\/pl\/?p=975"},"modified":"2024-03-01T18:43:05","modified_gmt":"2024-03-01T17:43:05","slug":"automatyczna-ocena-jakosci-artykulow-wielojezycznej-wikipedii-oraz-identyfikacja-istotnych-zrodel-jej-informacji-w-roznych-tematach","status":"publish","type":"post","link":"https:\/\/kie.ue.poznan.pl\/pl\/wiadomosci\/automatyczna-ocena-jakosci-artykulow-wielojezycznej-wikipedii-oraz-identyfikacja-istotnych-zrodel-jej-informacji-w-roznych-tematach\/","title":{"rendered":"Automatyczna ocena jako\u015bci artyku\u0142\u00f3w wieloj\u0119zycznej Wikipedii oraz identyfikacja istotnych \u017ar\u00f3de\u0142 jej informacji w r\u00f3\u017cnych tematach"},"content":{"rendered":"<p>Na Uniwersytecie Ekonomicznym w Poznaniu odby\u0142o si\u0119 otwarte seminarium naukowe Instytutu Informatyki i Ekonomii Ilo\u015bciowej pt. &#8222;Automatyczna ocena jako\u015bci artyku\u0142\u00f3w wieloj\u0119zycznej Wikipedii oraz identyfikacja istotnych \u017ar\u00f3de\u0142 jej informacji w r\u00f3\u017cnych tematach&#8221;. Podczas seminarium <a href=\"https:\/\/kie.ue.poznan.pl\/pl\/wlodzimierz-lewoniewski\/\">dr W\u0142odzimierz Lewoniewski<\/a> om\u00f3wi\u0142 metody oraz narz\u0119dzia wykorzystywane do analizy i oceny tre\u015bci w popularnej wieloj\u0119zycznej encyklopedii oraz sposob\u00f3w identyfikacji i oceny \u017ar\u00f3de\u0142 informacji. <!--more--><\/p>\n<p>Wikipedia, jako najwi\u0119ksza i najbardziej popularna og\u00f3lnodost\u0119pna encyklopedia internetowa, odgrywa wa\u017cn\u0105 rol\u0119 w globalnym dost\u0119pie do wiedzy i informacji. Ta platforma oferuje szybki dost\u0119p do ogromnej ilo\u015bci informacji na niemal ka\u017cdy temat, co czyni j\u0105 cennym zasobem dla uczni\u00f3w, student\u00f3w, nauczycieli i naukowc\u00f3w. Wikipedia umo\u017cliwia r\u00f3wny dost\u0119p do informacji dla os\u00f3b z r\u00f3\u017cnych \u015brodowisk i region\u00f3w \u015bwiata, przyczyniaj\u0105c si\u0119 do zacierania r\u00f3\u017cnic w dost\u0119pie do wiedzy. Obecnie ona posiada ponad 62 milion\u00f3w artyku\u0142\u00f3w w ponad <a href=\"https:\/\/meta.wikimedia.org\/wiki\/List_of_Wikipedias\" rel=\"noopener noreferrer\" target=\"_blank\">300 wersjach j\u0119zykowych<\/a>.<\/p>\n<p>Wolno\u015b\u0107 edytowania Wikipedii jest zar\u00f3wno jej wielkim atutem, jak i wyzwaniem. O ile wolno\u015b\u0107 w dodawaniu i modyfikacji artyku\u0142\u00f3w w tej encyklopedii umo\u017cliwia demokratyzacj\u0119 dost\u0119pu do wiedzy i wspiera globaln\u0105 wsp\u00f3\u0142prac\u0119, o tyle wymaga tak\u017ce skutecznych mechanizm\u00f3w kontroli jako\u015bci i moderacji. Wolno\u015b\u0107 edytowania Wikipedii pozwala ka\u017cdemu, niezale\u017cnie od poziomu wykszta\u0142cenia czy pozycji spo\u0142ecznej, przyczyni\u0107 si\u0119 do budowania i rozwijania og\u00f3lnodost\u0119pnego zasobu wiedzy. Umo\u017cliwia to szeroki dost\u0119p do tworzenia i udost\u0119pniania informacji. W por\u00f3wnaniu do tradycyjnych encyklopedii, Wikipedia mo\u017ce by\u0107 aktualizowana niemal natychmiast po pojawieniu si\u0119 nowych informacji czy wydarze\u0144. Jednak nale\u017cy r\u00f3wnie\u017c wzi\u0105\u0107 pod uwag\u0119, \u017ce ta wolno\u015b\u0107 edytowania Wikipedii mo\u017ce prowadzi\u0107 do celowego wprowadzania fa\u0142szywych informacji, usuni\u0119cia warto\u015bciowych tre\u015bci lub innych form wandalizmu, co podwa\u017ca wiarygodno\u015b\u0107 i jako\u015b\u0107 encyklopedii. Ponadto, r\u00f3\u017cne punkty widzenia i przekonania edytor\u00f3w mog\u0105 prowadzi\u0107 do stronniczo\u015bci w artyku\u0142ach, co mo\u017ce wp\u0142yn\u0105\u0107 na neutralno\u015b\u0107 i obiektywno\u015b\u0107 prezentowanych informacji. Poza tym, cz\u0119ste edycje i rewizje mog\u0105 prowadzi\u0107 do nadmiernej zmienno\u015bci niekt\u00f3rych artyku\u0142\u00f3w, co utrudnia utrzymanie sp\u00f3jno\u015bci i jako\u015bci informacji. W zwi\u0105zku z tym, zapewnienie wysokiej jako\u015bci wszystkich artyku\u0142\u00f3w w r\u00f3\u017cnych wersjach j\u0119zykowych w obliczu wolno\u015bci edytowania stanowi znacz\u0105ce wyzwanie. <\/p>\n<p>W Katedrze Informatyki Ekonomicznej prowadzone s\u0105 badania naukowe w obszarze tworzenia modeli do automatycznej oceny jako\u015bci artyku\u0142\u00f3w Wikipedii w r\u00f3\u017cnych j\u0119zykach. W ramach tych bada\u0144 zosta\u0142y opracowane setki miar. Niekt\u00f3re z nich zosta\u0142y zaimplementowane w ramach narz\u0119dzia <a href=\"https:\/\/pl.wikirank.net\" rel=\"noopener noreferrer\" target=\"_blank\">WikiRank<\/a>, kt\u00f3re pozwala na ocen\u0119 jako\u015bci z u\u017cyciem miary syntetycznej jako\u015bci w skali ci\u0105g\u0142ej od 0 do 100. Poni\u017cszy rysunek przedstawia jeden z wykres\u00f3w, przedstawionych podczas seminarium, gzie s\u0105 pokazane warto\u015bci \u015brednie jako\u015bci artyku\u0142\u00f3w Wikipedii w r\u00f3\u017cnych j\u0119zykach i tematach z u\u017cyciem tej miary (dane na luty 2024 roku, dost\u0119pna jest r\u00f3wnie\u017c <a href=\"https:\/\/data.lewoniewski.info\/seminarium\/\" rel=\"noopener noreferrer\" target=\"_blank\">wersja interaktywna<\/a> tego wykresu):<\/p>\n<p><a href=\"https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality.jpg\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-1024x617.jpg\" alt=\"\" width=\"640\" height=\"386\" class=\"aligncenter size-large wp-image-978\" srcset=\"https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-1024x617.jpg 1024w, https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-300x181.jpg 300w, https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-768x463.jpg 768w, https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-1536x925.jpg 1536w, https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality-360x217.jpg 360w, https:\/\/kie.ue.poznan.pl\/pl\/wp-content\/uploads\/2024\/03\/wikipedia2024quality.jpg 1917w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a><\/p>\n<p>Badania naukowe skupiaj\u0105 si\u0119 r\u00f3wnie\u017c na ocenie \u017ar\u00f3de\u0142 informacji podawanych w ramach artyku\u0142\u00f3w Wikipedii. Obecnie w artyku\u0142ach tej encyklopedii mo\u017cna znale\u017a\u0107 ponad 330 milion\u00f3w przypis\u00f3w (odno\u015bnik\u00f3w lub referencji) do \u017ar\u00f3de\u0142. Stosuj\u0105c r\u00f3\u017cne miary mo\u017cna oceni\u0107 istotno\u015b\u0107 poszczeg\u00f3lnych witryn internetowych jako \u017ar\u00f3de\u0142 informacji. Niekt\u00f3re z opracowanych modeli zosta\u0142y zaimplementowane w ramach narz\u0119dzia <a href=\"https:\/\/bestref.net\" rel=\"noopener noreferrer\" target=\"_blank\">BestRef<\/a>, kt\u00f3re zawiera informacje na temat ocen milion\u00f3w witryn internetowych. <\/p>\n<p>Automatyczna ocena jako\u015bci artyku\u0142\u00f3w Wikipedii ma na celu zidentyfikowanie, w jakim stopniu poszczeg\u00f3lne artyku\u0142y spe\u0142niaj\u0105 okre\u015blone kryteria jako\u015bci, takie jak kompletno\u015b\u0107, neutralno\u015b\u0107, wiarygodno\u015b\u0107 \u017ar\u00f3de\u0142 oraz styl. Proces ten jest szczeg\u00f3lnie istotny w kontek\u015bcie wieloj\u0119zyczno\u015bci Wikipedii, gdzie zr\u00f3\u017cnicowanie j\u0119zykowe i kulturowe wprowadza dodatkowe wyzwania. Algorytmy uczenia maszynowego, w tym klasyfikacja nadzorowana i nienadzorowana, mog\u0105 by\u0107 u\u017cywane do identyfikacji wzorc\u00f3w jako\u015bciowych w artyku\u0142ach, na podstawie wcze\u015bniej oznakowanych danych. <\/p>\n<p>Szczeg\u00f3ln\u0105 rol\u0119 w procesie tworzenia modeli oceny jako\u015bci mog\u0105 odrywa\u0107 otwarte semantyczne bazy wiedzy, takie jak <a href=\"https:\/\/www.dbpedia.org\/\" rel=\"noopener noreferrer\" target=\"_blank\">DBpedia<\/a> oraz <a href=\"https:\/\/www.wikidata.org\/wiki\/Wikidata:Main_Page?uselang=pl\" rel=\"noopener noreferrer\" target=\"_blank\">Wikidane<\/a>. Te zasoby s\u0105 istotnymi elementami ekosystemu otwartych danych oraz semantycznego Internetu. One umo\u017cliwiaj\u0105 zorganizowany i \u0142atwy dost\u0119p do ogromnych zbior\u00f3w wiedzy. Dzi\u0119ki strukturyzacji i semantycznej organizacji danych, DBpedia oraz Wikidane mog\u0105 by\u0107 cennym \u017ar\u00f3d\u0142em dla badaczy i naukowc\u00f3w. Umo\u017cliwiaj\u0105 one przeprowadzanie zaawansowanych analiz w wielu dziedzinach, od nauk spo\u0142ecznych, przez lingwistyk\u0119, a\u017c po biologi\u0119 i medycyn\u0119, otwieraj\u0105c nowe mo\u017cliwo\u015bci dla odkry\u0107 naukowych i innowacji. Podobnie jak Wikipedia, te projekty wspieraj\u0105 wieloj\u0119zyczne przetwarzanie danych, co jest kluczowe w kontek\u015bcie globalnego dost\u0119pu do wiedzy. <\/p>\n<p>Warto wspomnie\u0107 o tym, \u017ce lepsza jako\u015b\u0107 Wikipedii mo\u017ce si\u0119 przyczyni\u0107 do poprawy innych popularnych serwis\u00f3w i narz\u0119dzi. Na przyk\u0142ad, wyszukiwarki internetowe (np. Google, Bing) korzystaj\u0105 z danych z Wikipedii do wzbogacania swoich wynik\u00f3w wyszukiwania poprzez tzw. \u201epude\u0142ka wiedzy\u201d (knowledge boxes), kt\u00f3re pojawiaj\u0105 si\u0119 obok wynik\u00f3w wyszukiwania, dostarczaj\u0105c kr\u00f3tkich streszcze\u0144 i podstawowych informacji na temat szukanych termin\u00f3w lub osobisto\u015bci. Te podsumowania cz\u0119sto czerpi\u0105 tre\u015bci bezpo\u015brednio z Wikipedii, zapewniaj\u0105c u\u017cytkownikom szybki dost\u0119p do zwi\u0119z\u0142ych informacji. Inny przyk\u0142ad &#8211; narz\u0119dzia oparte o generatywn\u0105 sztuczn\u0105 inteligencj\u0119 (np. ChatGPT) wykorzystuj\u0105 dane z Wikipedii jako cz\u0119\u015b\u0107 swojego procesu uczenia. Wiedza zgromadzona w Wikipedii pomaga w trenowaniu modeli na r\u00f3\u017cnorodnych danych, co pozwala na tworzenie bardziej dok\u0142adnych i bogatych w tre\u015b\u0107 generowanych materia\u0142\u00f3w.<\/p>\n<p>Seminarium Instytutu Informatyki i Ekonomii Ilo\u015bciowej odby\u0142o si\u0119 w dniu <a href=\"https:\/\/ue.poznan.pl\/aktualnosci\/zaproszenie-na-otwarte-seminarium-iiiei-w-dniu-16-02-2024-r\/\" rel=\"noopener noreferrer\" target=\"_blank\">16 lutego 2024 roku<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Na Uniwersytecie Ekonomicznym w Poznaniu odby\u0142o si\u0119 otwarte seminarium naukowe Instytutu Informatyki i Ekonomii Ilo\u015bciowej pt. &#8222;Automatyczna ocena jako\u015bci artyku\u0142\u00f3w wieloj\u0119zycznej Wikipedii oraz identyfikacja istotnych \u017ar\u00f3de\u0142 jej informacji w r\u00f3\u017cnych tematach&#8221;. Podczas seminarium dr W\u0142odzimierz Lewoniewski om\u00f3wi\u0142 metody oraz narz\u0119dzia wykorzystywane do analizy i oceny tre\u015bci w popularnej wieloj\u0119zycznej encyklopedii oraz sposob\u00f3w identyfikacji i oceny \u017ar\u00f3de\u0142 informacji.<\/p>\n","protected":false},"author":1,"featured_media":976,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[8,227,276,203,233,9,10,6],"class_list":["post-975","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-wiadomosci","tag-dbpedia","tag-jakosc-informacji","tag-seminarium","tag-sztuczna-inteligencja","tag-wiarygodnosc-zrodel","tag-wikidane","tag-wikipedia","tag-wlodzimierz-lewoniewski"],"_links":{"self":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts\/975","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/comments?post=975"}],"version-history":[{"count":0,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts\/975\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/media\/976"}],"wp:attachment":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/media?parent=975"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/categories?post=975"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/tags?post=975"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}