Warsztaty dla studentów dotyczące eksploracji oraz przetwarzania treści dostępnych w Internecie odbyły się na Uniwersytecie Ekonomicznym w Poznaniu. Spotkanie poprowadził Mateusz Kuczyński, student naszej Uczelni, który łączy studia magisterskie na kierunku informatyka i ekonometria z pracą w obszarze eksploracji danych.
Podczas spotkania zostały omówione podstawy teoretyczne i praktyczne, niezbędne do rozpoczęcia samodzielnej działalności w zakresie pozyskiwania danych ze stron internetowych. Przedstawione zostały zagadnienia związane z pobieraniem i przetwarzaniem danych w formacie HTML, a także wskazano dobre praktyki i potencjalne wyzwania. Studenci mogli się dowiedzieć, w jaki sposób korzystać z wbudowanych narzędzi analitycznych, umożliwiających monitorowanie struktury HTML, stylów CSS oraz zapytań sieciowych w celu efektywnego identyfikowania elementów do późniejszego przetwarzania. Przedstawiono również metody efektywnego parsowania stron internetowych, pobierania ich zawartości oraz zapisywania uzyskanych informacji w formatach przyjaznych do dalszej analizy danych z wykorzystaniem takich bibliotek w języku programowania Python, jak bs4 (BeautifulSoup), requests, pandas. Uczestnicy warsztatów mieli okazję na bieżąco obserwować sposób implementacji poszczególnych kroków, zadawać pytania i dyskutować nad ewentualnymi problemami związanymi z selekcją danych czy ograniczeniami technicznymi.
Warsztaty odbyły się w dniu 19 grudnia 2024 roku. Wydarzenie zostało zorganizowane przez SKN Data Science.