AUTOR: Alina Wróblewska
AFILIACJA: IPI PAN
TYTUŁ: Międzyjęzykowe rzutowanie struktur F:
Indukcja zasobów dla języka polskiego
STRESZCZENIE:
Jednym ze stosunkowo nowych sposobów pozyskiwania zasobów
lingwistycznych jest metoda rzutowania międzyjęzykowego
(ang. cross-lingual projection). Wykorzystując korpus równoległy oraz
dostępne narzędzia, analizuje się zdania w języku źródłowym, a
następnie rzutuje uzyskane struktury analityczne na język docelowy
zgodnie z połączeniami międzysłownymi (ang. word-alignment). Metoda
rzutowania umożliwia w pełni automatyczną indukcję zasobów
lingwistycznych, które uzupełniając braki manualnie anotowanych banków
drzew mogą służyć jako materiał treningowy do indukcji nowych narzędzi
przetwarzania języka naturalnego.
W referacie zostanie przedstawiony eksperyment, w którym metoda
rzutowania międzyjęzykowego została zastosowana do pozyskania struktur
zależnościowych (struktur F) w języku polskim rzutowanych z języka
angielskiego.