AUTOR:     Łukasz Kobyliński, Łukasz Szałkiewicz
AFILIACJA: IPI PAN
TYTUŁ:     Dążenie do ideału, czyli co można poprawić w NKJP?

STRESZCZENIE:

Referat przedstawiać będzie wyniki wstępnych prac nad metodami
automatycznej detekcji błędów anotacyjnych w polskich korpusach
językowych, a w szczególności w Narodowym Korpusie Języka
Polskiego. Zaprezentowany zostanie przegląd klas błędów anotacji na
poziomie morfosyntaktycznym, które zauważone zostały w podkorpusie
ręcznie anotowanym, a także w pełnym korpusie, w którym anotacja
powstała w sposób automatyczny. Przedstawione zostaną następnie wyniki
bezpośredniego zastosowania na korpusie NKJP metod automatycznego
wykrywania błędów anotacyjnych, które zaproponowane zostały
oryginalnie dla języka angielskiego. Przeprowadzona zostanie dyskusja
możliwości ich dostosowania do specyfiki języka polskiego, aby uzyskać
lepsze wyniki wykrywania błędów w dalszych pracach.