AUTOR:     Łukasz Kobyliński
AFILIACJA: IPI PAN
TYTUŁ:     Metody nadzorowane w ujednoznacznianiu sensów słów
           korpusu dziedzinowego 

STRESZCZENIE:

Celem referatu jest przedstawienie wyników uzyskanych w czasie prac
nad zadaniem ujednoznaczniania sensów słów korpusu dziedzinowego w
języku polskim za pomocą metod nadzorowanego uczenia. Zadanie było
realizowane w ramach projektu NEKST. W czasie wystąpienia
zaprezentowane zostaną rezultaty eksperymentów z wykorzystaniem metod
stosowanych wcześniej dla języka angielskiego, metod regułowych oraz
rozszerzenie tych podejść poprzez wykorzystanie zewnętrznych źródeł
wiedzy lingwistycznej. Omówione zostaną również zasoby językowe
utworzone w czasie realizacji zadania, które składają się na nowo
powstały korpus ekonomiczny. Na podstawie doświadczeń z dezambiguacją
sensów w korpusie ekonomicznym i wcześniejszych eksperymentów na
zrównoważonym korpusie NKJP przedstawione zostaną wnioski na temat
doboru cech, które okazują się najlepiej reprezentować kontekst
słów ujednoznacznianych w zastosowaniu do metod uczenia maszynowego.