AUTOR: Alina Wróblewska AFILIACJA: IPI PAN TYTUŁ: Tworzenie banku struktur zależnościowych z wykorzystaniem metody rzutowania ważonego STRESZCZENIE: Międzyjęzykowe rzutowanie informacji lingwistycznych jest metodą automatycznego pozyskiwania zaanotowanych danych, głównie w językach nieposiadających niezbędnych narzędzi i zasobów lingwistycznych. Metoda ta stanowi alternatywę dla ręcznego anotowania zdań w języku naturalnym, które jest procesem bardzo kosztownym i czasochłonnym. Dane zaanotowane rzutowanymi informacjami lingwistycznymi mogą zostać wykorzystane do wytrenowania narzędzi przetwarzających język naturalny (np. taggerów, dyzambiguatorów sensów słów, analizatorów ról semantycznych). Metoda ta jest również wykorzystywana do rzutowania struktur zależnościowych, w których zostają zakodowane funkcje gramatyczne (np. podmiot, dopełnienie). Główna idea rzutowania drzew zależnościowych polega na automatycznej analizie składniowej zdania w języku źródłowym w korpusie równoległym, a następnie rzutowaniu relacji zależnościowych na tłumaczenie danego zdania w języku docelowym. Rzutowanie poszczególnych relacji odbywa się poprzez przyporządkowania słowne (ang. word alignment). Wyniki dotychczasowych eksperymentów stosujących metodę rzutowania struktur zależnościowych pokazały jednak, że bezpośrednie rzutowanie relacji nie przynosi pożądanych rezultatów. Przyczyną mogą być błędy w automatycznych przyporządkowaniach na poziomie słów i zdań, błędy w automatycznej analizie składniowej zdań źródłowych, czy swoboda w tłumaczeniach. Żeby podwyższyć jakość ostatecznych struktur, wprowadza się dodatkowe reguły korygujące lub metody filtrujące potencjalnie błędne struktury. Jednak obydwa rozwiązania nie są doskonałe, bo definiowanie reguł korygujących wymaga kosztownej pracy ręcznej oraz znajomości języka docelowego, a filtrowanie prowadzi do dużej utraty danych. Na seminarium zostanie zaprezentowana nowa metoda rzutowania ważonego, która wprowadza do tradycyjnej metody rzutowania czynnik ważenia zarówno na etapie rzutowania jak i indukcji drzew zależnościowych w języku docelowym.