SENECA: Semantic Networks and Categorization

Pozyskiwanie informacji zajmuje się takimi aspektami jak reprezentacja informacji, jej przechowywanie, organizowanie oraz określenie do niej dostępu. Reprezentacja i organizacja pojedynczych elementów informacji powinna zapewniać użytkownikowu dostęp do informacji, które odpowiadają jego zainteresowaniom.

Misja projektu
Ogólnym celem projektu SENECA jest uzyskanie lepszych wyników prezycji i stopy zwrotu w procesach pozyskiwania informacji, takich jak: wyszukiwanie, dopasowywanie i klasyfikacja dokumentów, identyfikacja usług sieciowych. Bardziej relewantne wyniki można uzyskać poprzez wykorzystanie odpowiedniej reprezentacji wiedzy: tezaurusów, sieci semantycznych oraz ontologii. Dostępność tych struktur jest jednak ograniczona. Z tego powodu, jednym z celów projektu jest ich automatyczne stworzenie na podstawie dostarczonej hierarchii konceptów, ujednoznacznienia słów i klasteringu pojęć.

Efektywne dopasowywanie dokumentów, wykorzystujące wiedzę opisaną semantycznie, może zostać użyte do ochrony własności intelektualnej w korporacji, np. dzięki wykrywaniu plagiatów, filtrowaniu strumienia dokumentów korporacji czy odpowiadających opatentowanych specyfikacji.

Cele projektu:

Automatyczne ujednoznacznianie pojęć.
Automatyczne tworzenie reprezentacji wiedzy dla danej domeny (budowanie ontologii) na podstawie źródeł z Sieci.
Ewaluacja ontologii na korpusach dokumentów z wybranych dziedzin.
Wykorzystanie ontologii, w celu poprawienia efektywności technik wyszukiwania.
Ochrona własności intelektualnej i wykrywanie plagiatów.
Wykorzystanie ontologii w procesie klasyfikacji usług sieciowych.
Identyfikowanie procesów biznesowych, które odpowiadają określonym usługom sieciowym.

P	W	Ś	C	P	S	N
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30