AUTOR:     Marcin Gołębski
AFILIACJA: Politechnika Warszawska
TYTUŁ:     Indukcja reguł gramatyki języka polskiego


STRESZCZENIE:

Seminarium poświęcone będzie tematyce indukcji reguł gramatyki języka
polskiego. Jest to problem łączący w sobie zagadnienia gramatyk
formalnych, przetwarzania języka naturalnego, uczenia maszynowego i
teorię wyuczalności.

Systemy informacyjne przetwarzające dokumenty języka naturalnego
operują gramatykami zawierającymi setki lub tysiące reguł opisujących
różne typy fraz. Pielęgnowanie tak dużych zbiorów reguł wzajemnie na
siebie wpływających jest praktycznie niewykonalne.  Stąd duże
zainteresowanie metodami umożliwiającymi ich automatyczne tworzenie.

Przedstawiony zostanie przegląd metod automatycznego anotowania
strukturalnego, ze szczególnym uwzględnieniem metod
statystycznych. Wskazane zostaną słabe strony istniejących kryteriów i
zidentyfikowane przyczyny tego stanu rzeczy. Przedstawione zostanie
nowe kryterium oceny wielopunktowych podziałów sekwencji pozbawione
wskazanych wad oraz zbudowaną na tej podstawie nieobciążoną metodę
oceny jakości struktur szkieletowych.