Wykład pt. „Co daje znajomość teorii w machine learningu?” organizowany przez SKN Data Science odbył się w dniu 24 stycznia. Podczas tego wydarzenia Jacek Jankowiak omówił istotne zagadnienia związane z uczeniem nadzorowanym.
Omówiony został problem znany jako „data leakage” pozwalający lepiej zarządzać ryzykiem związanym z rzetelną oceną tworzonych modeli oraz kontroli nad danymi wykorzystywanymi w procesie uczenia. Zostały również przedstawienie powody dla których dostępny zbiór danych jest dzielony na podzbiory treningowe, walidacyjne i testowe. To może umożliwić wykorzystywanie tej techniki w odpowiedni sposób w kontekście rozwiązywanego problemu. Wyjaśnione zostały także przekształcenie błędu MSE na kwadrat obciążenia oraz wariancję, co zobrazuje problem doboru odpowiedniego stopnia skomplikowania modelu. Przestawione zostały kwestie związane z kompromisem między obciążeniem a wariancją (tzw. „bias-variance tradeoff”) oraz jego konsekwencje dla nadmiernego i niedostatecznego dopasowania modelu do danych.
Warto zaznaczyć, że prelegent tego wydarzenia Jacek Jankowiak jest absolwentem Uniwersytetu Ekonomicznego w Poznaniu i podczas studiów wchodził w skład zarządu SKN Data Science.