AUTOR: Aleksandra Wieczorek AFILIACJA: Uniwersytet Warszawski i IPI PAN TYTUŁ: Korpus języka polskiej społeczności na Ukrainie i metody jego utworzenia W referacie zostanie przedstawiony elektroniczny korpus mowy mieszkańców jednej polskiej wsi na Ukrainie oraz program FonOrt, który został napisany do stworzenia tego korpusu. Korpus zawiera transkrypcje wywiadów z dwudziestoma informatorami i liczy ok. 140 tys. słów. Każdemu wyrazowi w tekstach przypisano m.in. postać hasłową, znaczenie, kwalifikator etymologiczny i informację o osobie mówiącej. Zadaniem programu było przede wszystkim przeprowadzenie lematyzacji (hasłowania) w tekstach w zapisie fonetycznym, zawierających wiele cech niewystępujących w polszczyźnie ogólnej.