AUTOR:     Alina Wróblewska
AFILIACJA: IPI PAN
TYTUŁ:     Tworzenie banku struktur zależnościowych z wykorzystaniem
           metody rzutowania ważonego 


STRESZCZENIE:

Międzyjęzykowe rzutowanie informacji lingwistycznych jest metodą
automatycznego pozyskiwania zaanotowanych danych, głównie w językach
nieposiadających niezbędnych narzędzi i zasobów
lingwistycznych. Metoda ta stanowi alternatywę dla ręcznego anotowania
zdań w języku naturalnym, które jest procesem bardzo kosztownym i
czasochłonnym. Dane zaanotowane rzutowanymi informacjami
lingwistycznymi mogą zostać wykorzystane do wytrenowania narzędzi
przetwarzających język naturalny (np. taggerów, dyzambiguatorów sensów
słów, analizatorów ról semantycznych).

Metoda ta jest również wykorzystywana do rzutowania struktur
zależnościowych, w których zostają zakodowane funkcje gramatyczne
(np. podmiot, dopełnienie). Główna idea rzutowania drzew
zależnościowych polega na automatycznej analizie składniowej zdania w
języku źródłowym w korpusie równoległym, a następnie rzutowaniu
relacji zależnościowych na tłumaczenie danego zdania w języku
docelowym. Rzutowanie poszczególnych relacji odbywa się poprzez
przyporządkowania słowne (ang. word alignment).

Wyniki dotychczasowych eksperymentów stosujących metodę rzutowania
struktur zależnościowych pokazały jednak, że bezpośrednie rzutowanie
relacji nie przynosi pożądanych rezultatów. Przyczyną mogą być błędy w
automatycznych przyporządkowaniach na poziomie słów i zdań, błędy w
automatycznej analizie składniowej zdań źródłowych, czy swoboda w
tłumaczeniach. Żeby podwyższyć jakość ostatecznych struktur, wprowadza
się dodatkowe reguły korygujące lub metody filtrujące potencjalnie
błędne struktury. Jednak obydwa rozwiązania nie są doskonałe, bo
definiowanie reguł korygujących wymaga kosztownej pracy ręcznej oraz
znajomości języka docelowego, a filtrowanie prowadzi do dużej utraty
danych.

Na seminarium zostanie zaprezentowana nowa metoda rzutowania ważonego,
która wprowadza do tradycyjnej metody rzutowania czynnik ważenia
zarówno na etapie rzutowania jak i indukcji drzew zależnościowych w
języku docelowym.