AUTOR: Łukasz Dębowski
AFILIACJA: IPI PAN
TYTUŁ: Ograniczenie rozmiaru słownika uniwersalnych kodów
gramatykowych
STRESZCZENIE:
Referat poświęcony będzie nowym osiągnięciom z zakresu teoretycznego
problemu kompresji danych, którym interesuję się od kilku lat.
Mianowicie, będę mówić o ścisłym dolnym ograniczeniu rozmiaru słownika
minimalnego uniwersalnego kodu gramatykowego (grammar-based code)
przez wartość informacji wzajemnej dla rozkładu stacjonarnego, z
którego losowany jest kompresowany tekst. Problem ten ma oryginalną
motywację lingwistyczną i zaskakujące konsekwencje, które postaram się
pokazać. Po pierwsze, wskażę na przydatność określenia długości
gramatyki bezkontekstowej w nieco inny sposób niż przyjmowany
dotychczas (co implikuje np. przeformułowanie algorytmicznego problemu
najmniejszej gramatyki bezkontekstowej dla tekstu). Po drugie, wskażę
na związek pomiędzy liczbą różnych słów w wylosowanym tekście a czymś,
co można by nazwać spójnością logiczną tekstu.