AUTOR: Dariusz Czerski AFILIACJA: IPI PAN TYTUŁ: Przetwarzanie języka naturalnego w wyszukiwarce Nekst STRESZCZENIE: W ramach seminarium przedstawione zostaną 3 zagadnienia związane z projektem Nekst: 1. System Nekst – metody przetwarzania języka naturalnego. W tej części prezentacji przedstawione zostaną metody przetwarzania języka naturalnego wykorzystane w wyszukiwarce Nekst oraz związane z tym problemy. 2. System szybkiej detekcji plagiatów w dużych zbiorach danych. W ramach prezentacji zostanie przedstawiony system szybkiej detekcji plagiatów zbudowany w oparciu metody przetwarzania języka naturalnego. Szczególny nacisk zostanie położony na rolę metod NLP w zadaniu detekcji drobnych modyfikacji treści, mających na celu zamaskowanie plagiatu. 3. Wzmocniona ekstrakcja relacji IS-A na bazie przypadka gramatycznego. Ostatnia część wykładu zostanie poświęcona metodzie ekstrakcji relacji ISA (hierarchii pojęć) za pomocą algorytmu bazującego na dwóch konstrukcjach językowych.