AUTOR:     Maciej Ogrodniczuk, Katarzyna Głowińska, Mateusz Kopeć,
           Agata Savary, Magda Zawisławska
AFILIACJA: IPI PAN
TYTUŁ:     Polski Korpus Koreferencyjny – wersja wstępna

STRESZCZENIE:

Przedmiotem wystąpienia będzie powstający w projekcie „Komputerowe
metody identyfikacji nawiązań w tekstach polskich” (CORE) korpus
koreferencji – wybrany z Narodowego Korpusu Języka Polskiego zbiór
tekstów z oznaczonymi a) frazami nominalnymi reprezentującymi
odwołania do obiektów pozatekstowych oraz b) ich rozłącznymi
klastrami, odpowiadającymi odwołaniom do tego samego bytu
(np. "Wisława Szymborska", "ona", "poetka", "noblistka"). Korpus
będzie wykorzystany do budowy algorytmów i narzędzi do wykrywania
koreferencji w tekstach polskich. Jest pierwszym tak obszernym zbiorem
tego typu dostępnym dla języka polskiego.