AUTOR: Adam Slaski AFILIACJA: Uniwersytet Warszawaski i Instytut Podstaw Informatyki PAN TYTUŁ: Zastosowanie metod statystycznych do zadania ujednoznaczniania struktury zdania w języku polskim STRESZCZENIE: Rozważmy zdania "widziałem kobietę w kapeluszu" i "widziałem kobietę w teatrze". Oba rzeczowniki 'kapelusz' i 'teatr' występują w miejscowniku, więc powierzchniowa analiza nie jest w stanie w tych zdaniach poprawnie przypisać nadrzędników frazom przyimkowym. Technicznie rzecz ujmując, zadanie polega na dezambiguacji wyjścia parsera Spejd. Proponujemy rozwiązanie tego problemu polegające na kilkustopniowej analizie statystycznej, uwzględniającej: (*) kolokacje, w tym frazeologizmy i stałe połączenia wyrazowe; (*) relacje semantyczne, w szczególności hiponimię i hiperonimię; (*) relacje syntaktyczne, na przykład rząd czasowników. W czasie (trwających nadal) eksperymentów wypróbowano różne miary statystyczne i różne kombinacje parametrów programu. Za materiały do badań posłużyły teksty z ręcznie anotowanego podkorpusu NKJP, zaś źródłem informacji semantycznej jest Słowosieć.