AUTOR: Łukasz Dębowski i Marcin Woliński AFILIACJA: IPI PAN TYTUŁ: Nowe metody ekstrakcji walencji czasowników z tekstów w języku polskim STRESZCZENIE Przedstawimy nową metodę ekstracji walencji czasowników z nieanotowanych tekstów. Metoda została opracowana dla języka, dla którego nie istnieje zweryfikowany bank drzew, ale istnieje duża gramatyka formalna oraz kilka słowników walencyjnych. Ekstrakcja walencja następuje w dwóch krokach. Najpierw używamy parsera Świgra oraz nowego prostego algorytmu typu EM (expectation-maximization), aby uzyskać niedoskonały bank drzew o analizach zredukowanych do ram walencyjnych czasowników. Następnie stosujemy prosty algorytm uczenia pod nadzorem, aby uzyskać słownik walencyjny z banku drzew. Aby otrzymany słownik cechowała wyższa dokładność (precision), stosujemy w szczególności nowatorską procedurę naprawy macierzy współwystąpień argumentów.