{"id":989,"date":"2024-03-22T17:02:44","date_gmt":"2024-03-22T16:02:44","guid":{"rendered":"https:\/\/kie.ue.poznan.pl\/pl\/?p=989"},"modified":"2024-03-28T12:46:26","modified_gmt":"2024-03-28T11:46:26","slug":"dwie-trzecie-nagrody-naszych-studentow-w-konkursie-eurostat-the-web-intelligence-deduplication-challenge","status":"publish","type":"post","link":"https:\/\/kie.ue.poznan.pl\/pl\/wiadomosci\/dwie-trzecie-nagrody-naszych-studentow-w-konkursie-eurostat-the-web-intelligence-deduplication-challenge\/","title":{"rendered":"Dwie trzecie nagrody naszych student\u00f3w w konkursie Eurostat &#8222;The Web Intelligence \u2013 Deduplication Challenge&#8221;"},"content":{"rendered":"<p>Studenci naszej specjalno\u015bci na kierunku Informatyka i Ekonometria &#8211; Miko\u0142aj Tym i Jakub \u017berebecki (2 stopie\u0144, 1 rok, specjalno\u015b\u0107 Informatyka w Gospodarce i Administracji) &#8211; wzi\u0119li udzia\u0142 w konkursie \u201eThe Web Intelligence \u2013 Deduplication Challenge\u201d organizowanym przez Eurostat pomi\u0119dzy grudniem 2022 a kwietniem 2023 roku. Realizowane zadanie dotyczy\u0142o dziedziny Data Science, a tak\u017ce przetwarzania j\u0119zyka naturalnego.<!--more--><\/p>\n<p>Celem konkursu by\u0142a identyfikacja potencjalnych duplikat\u00f3w ofert pracy zebranych ze stron internetowych w ca\u0142ej Unii Europejskiej. Zbi\u00f3r danych zawiera\u0142 112.000 og\u0142osze\u0144 o prac\u0119 w r\u00f3\u017cnych j\u0119zykach, kt\u00f3re nale\u017ca\u0142o sklasyfikowa\u0107 do jednej z kategorii:<\/p>\n<ol>\n<li>Unikalne og\u0142oszenia.<\/li>\n<li>Pe\u0142ne duplikaty &#8211; oferty maj\u0105ce ten sam tytu\u0142 i opis stanowiska.<\/li>\n<li>Semantyczne duplikaty &#8211; oferty dotycz\u0105ce tej samej pozycji zawodowej, ale wyra\u017cone w inny spos\u00f3b w j\u0119zyku naturalnym lub w r\u00f3\u017cnych j\u0119zykach.<\/li>\n<li>Czasowe duplikaty &#8211; semantyczne duplikaty z r\u00f3\u017cnymi datami pozyskania og\u0142oszenia.<\/li>\n<li>Cz\u0119\u015bciowe duplikaty \u2013 oferty dotycz\u0105ce tej samej pozycji zawodowej, ale zawieraj\u0105ce, np. dodatkowe wymagania wobec kandydata, kt\u00f3rych nie posiada pierwotna oferta.<\/li>\n<\/ol>\n<p>Nasi studenci przygotowali rozwi\u0105zanie w j\u0119zyku Python, kt\u00f3re z wykorzystaniem LLM (du\u017cy model j\u0119zykowy), a tak\u017ce innych metod przetwarzania j\u0119zyka naturalnego identyfikuje zduplikowane oferty pracy.<\/p>\n<p>W konkursie wzi\u0119\u0142o udzia\u0142 69 zespo\u0142\u00f3w z 17 kraj\u00f3w, a nasi studenci (zesp\u00f3\u0142 IDA) zaj\u0119li trzecie miejsca w dw\u00f3ch kategoriach:<\/p>\n<ol>\n<li>Accuracy \u2013 jak najdok\u0142adniejsza identyfikacja duplikat\u00f3w (3000 EUR).<\/li>\n<li>Reproducibility &#8211; opracowanie innowacyjnej i skalowalnej metodologii w celu tworzenia europejskich statystyk (3000 EUR).<\/li>\n<\/ol>\n<p>Szczeg\u00f3lne podzi\u0119kowania nale\u017c\u0105 si\u0119 <a href=\"https:\/\/kie.ue.poznan.pl\/pl\/krzysztof-wecel\/\">prof. Krzysztofowi W\u0119clowi<\/a>, kt\u00f3rego zaj\u0119cia zainspirowa\u0142y cz\u0142onk\u00f3w zespo\u0142u do rozwoju w Data Science oraz za jego bezcenn\u0105 pomoc i wsparcie podczas trwania konkursu!<\/p>\n<p>Wi\u0119cej informacji na stronie: <a href=\"https:\/\/statistics-awards.eu\/announcements\/winners-wi-1st-round\" rel=\"noopener noreferrer\" target=\"_blank\">statistics-awards.eu\/announcements\/winners-wi-1st-round<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Studenci naszej specjalno\u015bci na kierunku Informatyka i Ekonometria &#8211; Miko\u0142aj Tym i Jakub \u017berebecki (2 stopie\u0144, 1 rok, specjalno\u015b\u0107 Informatyka w Gospodarce i Administracji) &#8211; wzi\u0119li udzia\u0142 w konkursie \u201eThe Web Intelligence \u2013 Deduplication Challenge\u201d organizowanym przez Eurostat pomi\u0119dzy grudniem 2022 a kwietniem 2023 roku. Realizowane zadanie dotyczy\u0142o dziedziny Data Science, a tak\u017ce przetwarzania j\u0119zyka naturalnego.<\/p>\n","protected":false},"author":1,"featured_media":990,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[292,305,306,7,307,28,284,213],"class_list":["post-989","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-wiadomosci","tag-duze-modele-jezykowe","tag-eurostat","tag-jakub-zerebecki","tag-krzysztof-wecel","tag-mikolaj-tym","tag-nagrody","tag-przetwarzanie-jezyka-naturalnego","tag-python"],"_links":{"self":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts\/989","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/comments?post=989"}],"version-history":[{"count":0,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/posts\/989\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/media\/990"}],"wp:attachment":[{"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/media?parent=989"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/categories?post=989"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/kie.ue.poznan.pl\/pl\/wp-json\/wp\/v2\/tags?post=989"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}