AUTOR: Maciej Ogrodniczuk, Katarzyna Głowińska, Mateusz Kopeć, Agata Savary, Magda Zawisławska AFILIACJA: IPI PAN TYTUŁ: Polski Korpus Koreferencyjny – wersja wstępna STRESZCZENIE: Przedmiotem wystąpienia będzie powstający w projekcie „Komputerowe metody identyfikacji nawiązań w tekstach polskich” (CORE) korpus koreferencji – wybrany z Narodowego Korpusu Języka Polskiego zbiór tekstów z oznaczonymi a) frazami nominalnymi reprezentującymi odwołania do obiektów pozatekstowych oraz b) ich rozłącznymi klastrami, odpowiadającymi odwołaniom do tego samego bytu (np. "Wisława Szymborska", "ona", "poetka", "noblistka"). Korpus będzie wykorzystany do budowy algorytmów i narzędzi do wykrywania koreferencji w tekstach polskich. Jest pierwszym tak obszernym zbiorem tego typu dostępnym dla języka polskiego.