AUTOR: Piotr Pęzik AFILIACJA: Uniwersytet Łódzki TYTUŁ: Składowanie i przetwarzanie danych językowych w relacyjnej bazie danych -- korpus PELCRA i MySQL STRESZCZENIE: Istnieje wiele technologii, które umożliwiają przetwarzanie i składowanie anotowanych danych językowych, począwszy od najbardziej podstawowych formatów tekstowych, a na zaawansowanych binarnych strukturach danych implementowanych specjalnie dla potrzeb danego projektu kończąc. Referat ma na celu przedstawienie problematyki modelowania i przetwarzania danych językowych w architekturze relacyjnych baz danych (RDB). Główną zaletą takiego rozwiązania jest wysoki poziom standaryzacji oraz względna szybkość i przejrzystość mechanizmu serwowania danych w środowisku sieciowym. Z kolei, do wad technologii RDB należą pewne ograniczenia wynikające z użycia danej wersji języka SQL oraz związana z nimi potrzeba przenoszenia części logiki biznesowej systemu do warstwy aplikacji lub warstwy klienckiej. Referat został przygotowany w oparciu o doświadczenia z tworzeniem systemu składowania głównej wersji Korpusu Języka Polskiego PELCRA (http://korpus.ia.uni.lodz.pl), który został zaimplementowany w architekturze LAMP oraz JDBC - MySQL (wersja 4.1). Na uwagę zasługują również zaprezentowane w referacie możliwości oferowane przez udostępniony niedawno mechanizm bazy danych MySQL 5.0, takie jak procedury składowane, wyzwalacze, czy też tabele dynamiczne.