AUTOR: Joanna Rączaszek-Leonardi, Bartosz Kruszyński AFILIACJA: Uniwersytet Warszawski TYTUŁ: Wielowymiarowa przestrzeń semantyczna HAL jako narzędzie analizy korpusów języka polskiego Model wielowymiarowej przestrzeni semantycznej HAL (Hyperspace Analogue to Language) Burgessa i Lunda (1996) jest próbą przedstawienia znaczenia wyrazów za pomocą ich pozycji względem innych wyrazów w korpusach tekstów. Wyniki badań charakterystyk HAL'a w języku angielskim pokazują, że model dość dobrze odzwierciedla semantyczną bliskość wyrazów, potrafi grupować wyrazy z tych samych kategorii semantycznych i gramatycznych, oraz że na podstawie bliskości semantycznej określonej w HAL'u można w pewnym stopniu przewidzieć siłę torowania między wyrazami w eksperymentach psychologicznych. Celem niniejszego projektu jest określenie, czy taka charakterystyka semantyki ma sens w języku polskim (język o bardziej swobodnym szyku zdań niż jezyk angielski), oraz zbadanie, na ile bliskość semantyczna wyznaczona w HAL-u pozwala przewidzieć bliskość psychologicznych repezentacji pojęć (mierzonej siłą torowania). Wyniki wskazują na to, że HAL może być użytecznym sposobem przedsawiania znaczenia także na gruncie języka o swobodnym szyku zdania. Ciekawym zastosowaniem HAL'a może być porównywanie bliskości semantycznej wyrazów w różnych korpusach tekstów. Wyniki pierwszych prób użycia HAL'a jako narzędzia analizy i porównywania korpusów wydają się zachęcające.