AUTOR:     Dariusz Czerski
AFILIACJA: IPI PAN
TYTUŁ:     Przetwarzanie języka naturalnego w wyszukiwarce Nekst

STRESZCZENIE:

W ramach seminarium przedstawione zostaną 3 zagadnienia związane z
projektem Nekst:

1. System Nekst – metody przetwarzania języka naturalnego.  W tej
części prezentacji przedstawione zostaną metody przetwarzania języka
naturalnego wykorzystane w wyszukiwarce Nekst oraz związane z tym
problemy.

2. System szybkiej detekcji plagiatów w dużych zbiorach danych.  W
ramach prezentacji zostanie przedstawiony system szybkiej detekcji
plagiatów zbudowany w oparciu metody przetwarzania języka
naturalnego. Szczególny nacisk zostanie położony na rolę metod NLP w
zadaniu detekcji drobnych modyfikacji treści, mających na celu
zamaskowanie plagiatu.

3. Wzmocniona ekstrakcja relacji IS-A na bazie przypadka
gramatycznego.  Ostatnia część wykładu zostanie poświęcona metodzie
ekstrakcji relacji ISA (hierarchii pojęć) za pomocą algorytmu
bazującego na dwóch konstrukcjach językowych.