AUTOR: Janusz S. Bień AFILIACJA: Uniwersytet Warszawski TYTUŁ: Dygitalizacja słowników historycznych w Katedrze Lingwistyki Formalnej UW STRESZCZENIE: W referacie zostaną przedstawione krótko najważniejsze metody i narzędzia stosowane do dygitalizacji słowników i wybranych materiałów źródłowych, ze szczególnym uwzględnieniem wyszukiwarki leksykograficznej dostępnej pod adresem http://wbl.klf.uw.edu.pl/. AUTOR: Włodzimierz Gruszczyński(1) i Maciej Ogrodniczuk(2) AFILIACJA: Szkoła Wyższa Psychologii Społecznej(1) i IPI PAN(2) TYTUŁ: Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących z XVI, XVII i XVIII w. STRESZCZENIE: Projekt „Cyfrowa Biblioteka Druków Ulotnych Polskich i Polski Dotyczących z XVI, XVII i XVIII w.” miał na celu stworzenie dostępnej nieodpłatnie w Internecie biblioteki zawierającej możliwie wszystkie zachowane i opisane w literaturze starodruki ulotne. Zostały one zebrane głównie na podstawie zawierającej opisy prawie 2 tys. jednostek bibliograficznych pracy Konrada Zawadzkiego „Gazety ulotne polskie i Polski dotyczące od XVI-XVIII wieku”, rozszerzonej podczas kwerendy archiwalnej o pozycje odkryte lub opisane już po jej wydaniu. Dla dużej liczby druków (niespełna 70%) udostępniono jednocześnie w formacie DjVu ich skany wykonane z mikrofilmów znajdujących się w zbiorach Biblioteki Narodowej w Warszawie. Wybrane druki zostały skomentowane pod względem historycznym, medioznawczym lub lingwistycznym w celu objaśnienia mniej znanych realiów, których tekst zamieszczony w danym druku dotyczy oraz nieczytelnych dla współczesnego odbiorcy metafor i symboli. W wypadku tekstów tłumaczonych lub wzorowanych na tekstach obcojęzycznych, wskazane zostały teksty źródłowe (lub za takie uchodzące) oraz teksty pochodne, by ułatwić porównywanie różnojęzycznych wersji informacji dotyczących tego samego wydarzenia, a wywodzących się zapewne z jednego źródła. Tego rodzaju komentarze nie są obecne w dotychczasowych bibliotekach cyfrowych i stanowią novum projektu. Osobnym wynikiem projektu było dostosowanie platformy EPrints do wyszukiwania druków wg różnych kryteriów, zarówno takich, które standardowo wykorzystywane są w opisach bibliograficznych, jak i mniej typowych: tematycznych, gatunkowych i innych. W oparciu o tekst oryginalny uzupełniony o źródła wykryte w czasie trwania projektu wykonano ponadto elektroniczny skład typograficzny rozszerzonej wersji bibliografii Zawadzkiego. Projekt został zrealizowany w Instytucie Dziennikarstwa Uniwersytetu Warszawskiego i był dofinansowany ze środków Ministerstwa Kultury i Dziedzictwa Narodowego oraz Fundacji na rzecz Rozwoju Szkolnictwa Dziennikarskiego. Zbiory Biblioteki dostępne są pod adresem http://www.cbdu.pl oraz za pośrednictwem Federacji Bibliotek Cyfrowych. AUTOR: Agnieszka Mykowiecka AFILIACJA: IPI PAN TYTUŁ: Przetwarzanie historycznych dokumentów tekstowych w projekcie SYNAT STRESZCZENIE: Referat poświęcony będzie jednemu z licznych podzadań projektu „Utworzenie uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy” (SYNAT, www.synat.pl) zatytułowanemu: „Narzędzia wykorzystujące metody lingwistyki korpusowej i analizy dokumentów tekstowych”. Celem tego zadania jest opracowanie metod i narzędzi usprawniających proces udostępniania niewspółczesnych tekstów polskich. Dwa podstawowe problemy utrudniające ten proces to brak efektywnych metod zamiany starodruków na postać tekstową oraz różnice w słownictwie, które utrudniają zrozumienie starych tekstów. W ramach projektu SYNAT zajmować się będziemy głównie tym drugim zagadnieniem – budową i udostępnianiem słowników pojedynczych słów oraz fraz, a także interfejsami pozwalającymi na ich wykorzystanie w trakcie przeglądania starodruków. Referat poświecony będzie planom związanym z realizacją tych zadań i w zamierzeniu stanowić ma zachętę do dyskusji nad przyjętymi założeniami oraz możliwościami wykorzystania i rozwijania już istniejących zasobów oraz zaproszenie do ewentualnego udziału w budowie lub udoskonalaniu potrzebnych zasobów lingwistycznych.