AUTOR: Olgierd Unold
AFILIACJA: Instytut Informatyki, Automatyki i Robotyki,
Politechnika Wrocławska
TYTUŁ: Ewolucyjna indukcja gramatyki bezkontekstowej
STRESZCZENIE:
Przedstawiony zostanie nowy model ewolucyjnego wnioskowania
gramatycznego, którego zasadniczym przeznaczeniem jest indukcja
gramatyki bezkontekstowej. Konstrukcja modelu ewolucyjnego
wykorzystuje mechanizm uczenia stosowany w uczących się systemach
klasyfikujących (Grammar-based Classifier System, GCS). W modelu GCS
klasyfikatorami są produkcje gramatyki bezkontekstowej podane w
postaci normalnej Chomsky’ego, natomiast otoczeniem, do którego
adaptuje się system, jest zbiór uczący składający się z przykładowych
zdań opatrzonych etykietą określającą przynależność lub brak
przynależności zdania do poszukiwanego języka. Celem uczenia jest
poprawna klasyfikacja zdań uczących. Ponieważ zbiór klasyfikatorów
tworzy zestaw produkcji gramatyki, poprawna klasyfikacja
etykietowanych zdań oznacza wyindukowanie poszukiwanej gramatyki
języka. GCS śledzi produkcje użyte podczas analizy zbioru uczącego i
po jej zakończeniu oblicza funkcję dopasowania każdej produkcji. Nowe
produkcje gramatyki są odkrywane podczas procesu indukcji przez
mechanizm pokrycia oraz algorytm genetyczny.
Zaprezentowane zostaną wyniki indukcji języków regularnych z tzw.
zbioru benchmarkowego Tomity, wybranych formalnych języków
bezkontekstowych, a także obszernych anglojęzycznych korpusów
językowych. Model, poza obszarem inżynierii lingwistycznej, może mieć
zastosowanie również w genomice obliczeniowej, a w rozwijanej obecnie
wersji akceptującej na wejściu ciągi liczb rzeczywistych (rGCS) w
klasyfikacji obiektów przestrzennych.
Ewolucyjne
wnioskowanie gramatyczne