AUTOR: Dawid Weiss AFILIACJA: Politechnika Poznańska TYTUŁ: O algorytmach grupowania wyników z wyszukiwarek internetowych i propozycjach ich ulepszenia z wykorzystaniem wiedzy lingwistycznej STRESZCZENIE: Tematem referatu będzie prezentacja istoty problemu i algorytmów służących do tematycznego grupowania wyników zwracanych przez wyszukiwarki Internetowe (Google, AllTheWeb). Wyniki zwracane przez wyszukiwarki są zazwyczaj posortowaną listą krótkich fragmentów tekstu pochodzących z dokumentów zawierających wszystkie słowa w wydanym przez użytkownika zapytaniu. W świetle tego, że większość zapytań ma jednak charakter ogólny i wielodziedzinowy, wyniki zwracane przez wyszukiwarki często przeplatają dokumenty o różnej tematyce. Zadaniem algorytmów grupowania jest zatem wychwycenie informacji o tematycznej bliskości dokumentów oraz utworzenie dla odkrytych grup opisów, które będą intuicyjne dla użytkownika. Podczas trwania referatu zaprezentowane zostaną istniejące podejścia do opisywanego problemu, wywodzące się głównie z dziedziny odkrywania wiedzy. Dyskusja wad i zalet tych algorytmów, opierających się głównie na informacji frekwencyjnej o słowach w analizowanym tekście, pozwoli na zaprezentowanie pomysłów dotyczących wykorzystania informacji lingwistycznej w celu ich usprawnienia. Odbędzie się również demonstracja systemu Carrot2 -- meta-wyszukiwarki grupującej, przy pomocy której testowane są nowe pomysły i koncepcje dotyczące rozważanego tematu.