AUTOR:     Adam Radziszewski
AFILIACJA: Politechnika Wrocławska
TYTUŁ:     Warstwowy tager pamięciowy i kwestia oceny
           tagerów morfosyntaktycznych 

STRESZCZENIE:

Podczas wystąpienia zostanie omówiony problem oceny tagerów
morfosyntaktycznych na przykładzie tagera pamięciowego WMBT.

W pierwszej kolejności przedstawiony zostanie pierwszy wariant metody
znakowania morfosyntaktycznego, która została zaimplementowana we
wspomnianym tagerze. Przedstawione zostaną wyniki oceny tagerów WMBT i
PANTERA pod kątem trafności wykreślania — popularnej miary oceny
tagerów języka polskiego.

Druga część prezentacji poświęcona będzie dyskusji na temat procedury
oceny. Ocena tagera przez pryzmat trafności wykreślania zaniedbuje dwa
istotne typy rzeczywistych błędów: błędy segmentacji i błędy analizy
morfologicznej. Zaproponowane zostaną dwie miary, które pozwalają
poznać lepsze przybliżenie rzeczywistego odsetka błędów popełnianego
przez tager. Wyniki ponownej oceny tagerów przy użyciu zaproponowanych
miar wskazują na niepokojąco duży odsetek błędu wynikającego z
niedoskonałości analizatora morfologicznego i modułu
segmentacji. Obserwacje te pozwoliły na wprowadzenie dwóch ulepszeń do
tagera WMBT, które znacząco podniosły jego trafność.

W ostatniej części przedstawiona zostanie analogia między omawianymi
zagadnieniami, a dobrze znanym problemem wpływu tagera na działanie
parsera.