Kompozycyjne podejście do anafory i referencji na gruncie semantyki dynamicznej. Maciej Piasecki Wydziałowy Zakład Informatyki, Politechnika Wrocławska, piasecki@ci.pwr.wroc.pl Streszczenie W pewnym uproszczeniu można stwierdzić, że u podstaw teorii DRT [10], która stała się niemal standardowym formalizmem opisu znaczenia wielozdaniowej wypowiedzi w języku naturalnym (nazywanej dalej tekstem), leżało dążenie do stworzenia teorii interpretacji temporalnej i nominalnej anafory w tekście. W działaniu reguł konstrukcyjnych DRT, budujących struktury reprezentacji znaczenia (SRZ) tekstu, ważną rolę spełnia mechanizm identyfikacji poprzedników dla wyrażeń anaforycznych (głównie zaimków). Proces identyfikacji zachodzi w określonym stanie kontekstu interpretacji, opisywanym poprzez SRZ stworzone dla fragmentu tekstu poprzedzającego dane wyrażenie. Niestety identyfikacja zachodzi na meta-poziomie opisu znaczenia tekstu, w dziedzinie wyrażeń języka SRZ, czyli struktur DRS [10]. Jest to jedną z przyczyn niekompozycyjności 'standardowego' DRT (tzn. w kształcie pracy [10]). Ścisła kompozycyjność opisu znaczenia jest istotną cechą formalizmu reprezentacji znaczenia: upraszcza proces generowania SRZ, pozwala na przypisanie znaczenia wyrażeniom dowolnej kategorii składniowej a nie tylko kompletnym zdaniom np. rozpoznanym fragmentom wypowiedzi zawierającej błędy lub zniekształconej. Zaproponowano wiele kompozycyjnych wersji DRT, zwięzły przegląd przedstawiono w [6], jednak większość z nich w reprezentacji mechanizmu anafory bazuje na założonym uprzednim poindeksowaniu tekstu na poziomie analizy składniowej (drzewo rozbioru składniowego musi zawierać indeksy określające pary wyrażeń powiązanych anaforycznie). Przypisane indeksy wyznaczają nazwy znaczników (rodzaj zmiennych reprezentujących byty). Tworzące się w ten sposób powiązania są niejako 'zakodowane' we wszystkich częściach SRZ całego tekstu. W ten sposób mechanizm reprezentacji anafory został w kompozycyjnych wersjach DRT niejako wyłączony z reprezentacji znaczenia tekstu (w przeciwieństwie do 'standardowego' DRT). Celem długofalowym prezentowanych tu badań jest konstrukcja kompozycyjnej teorii znaczenia tekstu jako podstawy systemów przetwarzających tekst np. systemów ekstrakcji informacji, komunikacji z maszyną w języku naturalnym. Prezentowana tu praca koncentruje się na w pełni kompozycyjnej reprezentacji znaczenia frazy nominalnej jako elementu struktury tekstu. Pełna kompozycyjność proponowanej reprezentacji oznacza objęcie kompozycyjnym opisem zarówno kwantyfikacji i aspektu deskryptywny znaczenia, jak i też mechanizmów anafory, referencji i presupozycji [3]. Mechanizmy te są wzmiankowane jedynie w większości kompozycyjnych wersji DRT [6]. Zgodnie z paradygmatem semantyki dynamicznej [8] znaczenie wyrażenia jest utożsamiane ze zmianą jaką jego interpretacja wprowadza do kontekstu interpretacji. Na proponowane tu rozwiązanie składa się definicja formalnego języka logicznego, nazwanego Samoorganizująca się Logika Struktur (SLS), oraz kompozycyjny mechanizm konstrukcji reprezentacji znaczenia tekstu w postaci termów SLS. Punktem wyjścia do konstrukcji SLS jest metafora pamięci komputera, w ramach, której znaczniki są postrzegane jako 'komórki pamięci' przechowujące informacje o obiektach wymienianych w tekście poprzez użycie fraz nominalnych. Kontekst interpretacji utożsamiany jest ze stanem 'pamięci'. Pamięć może zawierać również informacje o obiektach znanych odbiorcy z poza tekstu. Powiązania anaforyczne i referencyjne są modelowane poprzez mechanizm więzów nakładanych na wartości 'przechowywane' w odpowiednich komórkach pamięci. Znaczenie zdania, tekstu identyfikowane jest z relacją na stanach ('stanach informacyjnych odbiorcy') wyrażaną przez interpretację odpowiedniego termu SLS. Struktura powiązań pomiędzy znacznikami nie wynika ze wstępnie przypisanych nazw zmiennych po znacznikach. Jest tworzona dynamicznie poprzez mechanizm operatora referencji identyfikującego odpowiednie znaczniki jako potencjalne poprzedniki znacznika rozpatrywanego (nazwa to analogia do definicji referencji Hessa [9]). Rozwiązanie to jest podobne do formalnej definicji importu / eksportu zmiennych w Systemie Referencyjnym Vermeulena [16], jednak nie jest, jak tam, 'sterowane' przypisaniem nazw do eksportowanych / importowanych znaczników. Operator referencji działa niedeterministycznie w dziedzinie dostępnych znaczników (stąd "samoorganizująca się"). Dlatego też, zmienne po znacznikach pełnią marginalną rolę w SLS, termy składowe formuł są łączone poprzez powiązania. Celem SLS nie jest szczegółowy opis procesu rozwiązywania powiązań anaforycznych a jedynie wyrażenie warunków koniecznych spełnianych przez proces identyfikacji poprzednika na poziomie semantyki (własności obiektów przypisanych do znaczników) oraz na poziomie składni (strukturalne pojęcie dostępności znaczników). Konstrukcja SLS wykorzystuje technikę warstwowej definicji logiki, zastosowaną między innymi przez Muskensa [11]. Wyrażenie SLS definiowane są jako skróty notacyjne wyrażeń standardowej logiki typów. Zbiór typów SLS obejmuje standardowe typy: e (bytów) i t (wartości logicznych) oraz dodatkowy typ m - znaczników dyskursu (nazwa sortu od memory cells). Denotacja De to dowolny niepusty zbiór, Dt={0,1}, natomiast Dm to nieskończony zbiór z nałożonym porządkiem całkowitym