SENECA: Semantic Networks and Categorization

Pozyskiwanie informacji zajmuje się takimi aspektami jak reprezentacja informacji, jej przechowywanie, organizowanie oraz określenie do niej dostępu. Reprezentacja i organizacja pojedynczych elementów informacji powinna zapewniać użytkownikowu dostęp do informacji, które odpowiadają jego zainteresowaniom.

Misja projektu
Ogólnym celem projektu SENECA jest uzyskanie lepszych wyników prezycji i stopy zwrotu w procesach pozyskiwania informacji, takich jak: wyszukiwanie, dopasowywanie i klasyfikacja dokumentów, identyfikacja usług sieciowych. Bardziej relewantne wyniki można uzyskać poprzez wykorzystanie odpowiedniej reprezentacji wiedzy: tezaurusów, sieci semantycznych oraz ontologii. Dostępność tych struktur jest jednak ograniczona. Z tego powodu, jednym z celów projektu jest ich automatyczne stworzenie na podstawie dostarczonej hierarchii konceptów, ujednoznacznienia słów i klasteringu pojęć.

Efektywne dopasowywanie dokumentów, wykorzystujące wiedzę opisaną semantycznie, może zostać użyte do ochrony własności intelektualnej w korporacji, np. dzięki wykrywaniu plagiatów, filtrowaniu strumienia dokumentów korporacji czy odpowiadających opatentowanych specyfikacji.

Cele projektu:

  • Automatyczne ujednoznacznianie pojęć.
  • Automatyczne tworzenie reprezentacji wiedzy dla danej domeny (budowanie ontologii) na podstawie źródeł z Sieci.
  • Ewaluacja ontologii na korpusach dokumentów z wybranych dziedzin.
  • Wykorzystanie ontologii, w celu poprawienia efektywności technik wyszukiwania.
  • Ochrona własności intelektualnej i wykrywanie plagiatów.
  • Wykorzystanie ontologii w procesie klasyfikacji usług sieciowych.
  • Identyfikowanie procesów biznesowych, które odpowiadają określonym usługom sieciowym.