AUTOR: Marek Łaziński, Izabela Winiarska-Górska AFILIACJA: Instytut Języka Polskiego UW TYTUŁ: Korpus polsko-rosyjski i Korpus Języka Młodzieży UW STRESZCZENIE: Referat wprowadza w krajobraz korpusowy warszawskiej polonistyki, a dokładniej omawia 2 projekty współprowadzone przez autorów. Korpus Polsko-Rosyjski, zgromadzony w latach 2010-2013 z grantu NCN, liczy 30 mln słów po połowie w tekstach polskich i rosyjskich we wzajemnych przekładach. W 50% są to teksty oryginalnie polskie, w 35% rosyjski, 15% to teksty tłumaczone z trzeciego języka. Po omówieniu struktury korpusu, tagowania oraz możliwości i ograniczeń wyszukiwarki zwrócimy uwagę na aspekty kulturowe tworzenia korpusów równoległych, które odróżniają je od korpusów wielojęzycznych. Strona projektu:pol-ros.polon.uw.edu.pl Drugi projekt, któremu poświęcimy najwięcej czasu, jest jeszcze w trakcie rozwoju. Korpus Języka Młodzieży Warszawskiej powstał w ramach projektu „Laboratorium Języka Młodzieży”, a ten w ramach projektu Ministerstwa Nauki i Szkolnictwa Wyższego „Ścieżki Kopernika”. Cechą wyróżniającą nasz korpus wśród innych projektów korpusowych była aktywna rola młodzieży jako rozmówców i badawczy słownictwa. Uczniowie z 10 kilkuosobowych zespołów uczniowskich z 10 szkół mazowieckich nie tylko nagrywali rozmowy do korpusu, ale też nadsyłali propozycje opisu leksykograficznego słów nieopisanych do tej pory w słownikach slangów. Korpus gromadzi oj 150 tys. słów w rozmowach (w tej chwili zindeksowane w wyszukiwarce 80 tys.), 300 tys. słów z gazetek szkolnych, blogów i pracach pisemnych uczniów oraz ponad milion słów literatury młodzieżowej 2. połowy XX wieku jako korpus porównawczy. Równocześnie z tworzeniem korpusu i słowniczka slangu w ramach projektu przeprowadziliśmy w szkołach prezentację wykorzystania NKJP w dydaktyce, a nauczyciele poloniści uczestniczący w projekcie opracowali na podstawie NKJP 22 scenariuszy lekcji. Wyszukiwarka to przerobiony przez Jarosława Strojka program Poliqarp z interfejsem okienkowym wykorzystującym szkolne kategorie gramatyczne, który oprócz tagów gramatycznych wprowadzanych przez tager TAKIPI, dodatkowo umożliwia wyszukiwanie według danych socjologicznych: płci, wieku, wykształcenia i konkretnej szkoły oraz nowych tagów charakteryzujących poszczególne wyrazy slangowe. Strona projektu: laboratoriumjezykowe.uw.edu.pl