Pozyskiwanie informacji zajmuje się takimi aspektami jak reprezentacja informacji, jej przechowywanie, organizowanie oraz określenie do niej dostępu. Reprezentacja i organizacja pojedynczych elementów informacji powinna zapewniać użytkownikowu dostęp do informacji, które odpowiadają jego zainteresowaniom.
Misja projektu
Ogólnym celem projektu SENECA jest uzyskanie lepszych wyników prezycji i stopy zwrotu w procesach pozyskiwania informacji, takich jak: wyszukiwanie, dopasowywanie i klasyfikacja dokumentów, identyfikacja usług sieciowych. Bardziej relewantne wyniki można uzyskać poprzez wykorzystanie odpowiedniej reprezentacji wiedzy: tezaurusów, sieci semantycznych oraz ontologii. Dostępność tych struktur jest jednak ograniczona. Z tego powodu, jednym z celów projektu jest ich automatyczne stworzenie na podstawie dostarczonej hierarchii konceptów, ujednoznacznienia słów i klasteringu pojęć.
Efektywne dopasowywanie dokumentów, wykorzystujące wiedzę opisaną semantycznie, może zostać użyte do ochrony własności intelektualnej w korporacji, np. dzięki wykrywaniu plagiatów, filtrowaniu strumienia dokumentów korporacji czy odpowiadających opatentowanych specyfikacji.
Cele projektu:
- Automatyczne ujednoznacznianie pojęć.
- Automatyczne tworzenie reprezentacji wiedzy dla danej domeny (budowanie ontologii) na podstawie źródeł z Sieci.
- Ewaluacja ontologii na korpusach dokumentów z wybranych dziedzin.
- Wykorzystanie ontologii, w celu poprawienia efektywności technik wyszukiwania.
- Ochrona własności intelektualnej i wykrywanie plagiatów.
- Wykorzystanie ontologii w procesie klasyfikacji usług sieciowych.
- Identyfikowanie procesów biznesowych, które odpowiadają określonym usługom sieciowym.