AUTOR:     Aleksandra Wieczorek
AFILIACJA: Uniwersytet Warszawski i IPI PAN
TYTUŁ:     Korpus języka polskiej społeczności na Ukrainie i metody jego utworzenia

W referacie zostanie przedstawiony elektroniczny korpus mowy
mieszkańców jednej polskiej wsi na Ukrainie oraz program FonOrt, który
został napisany do stworzenia tego korpusu. Korpus zawiera
transkrypcje wywiadów z dwudziestoma informatorami i liczy ok. 140
tys. słów.  Każdemu wyrazowi w tekstach przypisano m.in. postać
hasłową, znaczenie, kwalifikator etymologiczny i informację o osobie
mówiącej. Zadaniem programu było przede wszystkim przeprowadzenie
lematyzacji (hasłowania) w tekstach w zapisie fonetycznym,
zawierających wiele cech niewystępujących w polszczyźnie ogólnej.