AUTOR:     Piotr Pęzik
AFILIACJA: Uniwersytet Łódzki
TYTUŁ:     Składowanie i przetwarzanie danych językowych w relacyjnej
           bazie danych -- korpus PELCRA i MySQL 

STRESZCZENIE:

Istnieje wiele technologii, które umożliwiają przetwarzanie i
składowanie anotowanych danych językowych, począwszy od najbardziej
podstawowych formatów tekstowych, a na zaawansowanych binarnych
strukturach danych implementowanych specjalnie dla potrzeb danego
projektu kończąc. Referat ma na celu przedstawienie problematyki
modelowania i przetwarzania danych językowych w architekturze
relacyjnych baz danych (RDB). Główną zaletą takiego rozwiązania jest
wysoki poziom standaryzacji oraz względna szybkość i przejrzystość
mechanizmu serwowania danych w środowisku sieciowym. Z kolei, do wad
technologii RDB należą pewne ograniczenia wynikające z użycia danej
wersji języka SQL oraz związana z nimi potrzeba przenoszenia części
logiki biznesowej systemu do warstwy aplikacji lub warstwy
klienckiej. Referat został przygotowany w oparciu o doświadczenia z
tworzeniem systemu składowania głównej wersji Korpusu Języka Polskiego
PELCRA (http://korpus.ia.uni.lodz.pl), który został zaimplementowany w
architekturze LAMP oraz JDBC - MySQL (wersja 4.1). Na uwagę zasługują
również zaprezentowane w referacie możliwości oferowane przez
udostępniony niedawno mechanizm bazy danych MySQL 5.0, takie jak
procedury składowane, wyzwalacze, czy też tabele dynamiczne.