Semantyczny Monitoring Cyberprzestrzeni

Podmioty publiczne i prywatne nieustannie analizują swoje otoczenie w celu wykrycia potencjalnych zagrożeń dla prowadzonej działalności. Przykładowo, systemy bankowe badają transakcje odbiegające od typowych, a systemy obsługujące giełdy towarowe i finansowe wyszukują ponadprzeciętnych zysków, aby określić, czy transakcja nie została zawarta z wykorzystaniem niedozwolonych informacji.

Celem projektu SMC, finansowanego przez Narodowe Centrum Badań i Rozwoju, jest opracowanie metody oraz prototypu narzędzia, umożliwiającego integrację danych oraz informacji pochodzących ze zróżnicowanych źródeł dla potrzeb ochrony cyberprzestrzeni poprzez wykrywanie zagrożeń, które manifestowane są w tych źródłach. W celu wykrywania zagrożeń w cyberprzestrzeni, w projekcie SMC monitorowane są ustrukturyzowane i nieustrukturyzowane zasoby płytkiego i głębokiego Internetu. Zintegrowane dane i informacje filtrowane są pod kątem wystąpienia nieprawidłowości związanych z wystąpieniem zagrożenia.

Cechy systemu

  • Źródłem informacji dla systemu są ogólnodostępne dokumenty pochodzące z Internetu płytkiego oraz głębokiego. Projekt przewiduje także przetwarzanie danych słabo ustrukturyzowanych będących tekstem w języku naturalnym.
  • Przetwarzane przez system dane pochodzą z wielu źródeł, charakteryzujących się różnym stopniem ustrukturyzowania treści.
  • Zdefiniowane źrodła są stale monitorowane w celu wykrycia nieprawidłowości, mogących świadczyć o wystąpieniu zagrożenia.
  • Informacje o konkretnej klasie zagrożenia przechowywane są w profilach zagrożeń, które umożliwiają filtrowanie monitorowanych źródeł.
  • Profile zagrożeń podlegają ewolucji i budowane są automatycznie z wykorzystaniem zdefiniowanych przez specjalistów reguł.
  • Brak konieczności angażowania specjalistów dziedzinowych w procesie monitorowania wystąpienia określonej klasy zagrożeń. Ich wkład niezbędny jest jedynie przy definiowaniu metod działania systemu.

Unikalne możliwości proponowanego rozwiązania

  • Ekstrakcja informacji z tekstów słabo ustrukturyzowanych, np. serwisów społecznościowych, portali aukcyjnych.
  • Integracja pozyskanych informacji pochodzących z różnych źródeł, zarówno ogólnodostępnych źródeł internetowych, jak i wewnętrznych baz danych.
  • Automatyczne wykrywanie zagrożeń manifestujących się w monitorowanych źródłach.
  • Wykrywany rodzaj zagrożenia uzależniony jest jedynie od zdefiniowanych przez ekspertów reguł budowania profilu. Tym samym rozwiązanie jest uniwersalne i może służyć do wykrywania różnych zagrożeń.

Strona projektu: http://smc.kie.ue.poznan.pl/pl/