Podmioty publiczne i prywatne nieustannie analizują swoje otoczenie w celu wykrycia potencjalnych zagrożeń dla prowadzonej działalności. Przykładowo, systemy bankowe badają transakcje odbiegające od typowych, a systemy obsługujące giełdy towarowe i finansowe wyszukują ponadprzeciętnych zysków, aby określić, czy transakcja nie została zawarta z wykorzystaniem niedozwolonych informacji.
Celem projektu SMC, finansowanego przez Narodowe Centrum Badań i Rozwoju, jest opracowanie metody oraz prototypu narzędzia, umożliwiającego integrację danych oraz informacji pochodzących ze zróżnicowanych źródeł dla potrzeb ochrony cyberprzestrzeni poprzez wykrywanie zagrożeń, które manifestowane są w tych źródłach. W celu wykrywania zagrożeń w cyberprzestrzeni, w projekcie SMC monitorowane są ustrukturyzowane i nieustrukturyzowane zasoby płytkiego i głębokiego Internetu. Zintegrowane dane i informacje filtrowane są pod kątem wystąpienia nieprawidłowości związanych z wystąpieniem zagrożenia.
Cechy systemu
- Źródłem informacji dla systemu są ogólnodostępne dokumenty pochodzące z Internetu płytkiego oraz głębokiego. Projekt przewiduje także przetwarzanie danych słabo ustrukturyzowanych będących tekstem w języku naturalnym.
- Przetwarzane przez system dane pochodzą z wielu źródeł, charakteryzujących się różnym stopniem ustrukturyzowania treści.
- Zdefiniowane źrodła są stale monitorowane w celu wykrycia nieprawidłowości, mogących świadczyć o wystąpieniu zagrożenia.
- Informacje o konkretnej klasie zagrożenia przechowywane są w profilach zagrożeń, które umożliwiają filtrowanie monitorowanych źródeł.
- Profile zagrożeń podlegają ewolucji i budowane są automatycznie z wykorzystaniem zdefiniowanych przez specjalistów reguł.
- Brak konieczności angażowania specjalistów dziedzinowych w procesie monitorowania wystąpienia określonej klasy zagrożeń. Ich wkład niezbędny jest jedynie przy definiowaniu metod działania systemu.
Unikalne możliwości proponowanego rozwiązania
- Ekstrakcja informacji z tekstów słabo ustrukturyzowanych, np. serwisów społecznościowych, portali aukcyjnych.
- Integracja pozyskanych informacji pochodzących z różnych źródeł, zarówno ogólnodostępnych źródeł internetowych, jak i wewnętrznych baz danych.
- Automatyczne wykrywanie zagrożeń manifestujących się w monitorowanych źródłach.
- Wykrywany rodzaj zagrożenia uzależniony jest jedynie od zdefiniowanych przez ekspertów reguł budowania profilu. Tym samym rozwiązanie jest uniwersalne i może służyć do wykrywania różnych zagrożeń.
Strona projektu: http://smc.kie.ue.poznan.pl/pl/