AUTOR:     Marek Łaziński, Izabela Winiarska-Górska
AFILIACJA: Instytut Języka Polskiego UW
TYTUŁ:     Korpus polsko-rosyjski i Korpus Języka Młodzieży UW

STRESZCZENIE:

Referat wprowadza w krajobraz korpusowy warszawskiej polonistyki, a
dokładniej omawia 2 projekty współprowadzone przez autorów.

Korpus Polsko-Rosyjski, zgromadzony w latach 2010-2013 z grantu NCN,
liczy 30 mln słów po połowie w tekstach polskich i rosyjskich we
wzajemnych przekładach. W 50% są to teksty oryginalnie polskie, w 35%
rosyjski, 15% to teksty tłumaczone z trzeciego języka. Po omówieniu
struktury korpusu, tagowania oraz możliwości i ograniczeń wyszukiwarki
zwrócimy uwagę na aspekty kulturowe tworzenia korpusów równoległych,
które odróżniają je od korpusów wielojęzycznych.

Strona projektu:pol-ros.polon.uw.edu.pl

Drugi projekt, któremu poświęcimy najwięcej czasu, jest jeszcze w
trakcie rozwoju. Korpus Języka Młodzieży Warszawskiej powstał w ramach
projektu „Laboratorium Języka Młodzieży”, a ten w ramach projektu
Ministerstwa Nauki i Szkolnictwa Wyższego „Ścieżki Kopernika”. Cechą
wyróżniającą nasz korpus wśród innych projektów korpusowych była
aktywna rola młodzieży jako rozmówców i badawczy słownictwa. Uczniowie
z 10 kilkuosobowych zespołów uczniowskich z 10 szkół mazowieckich nie
tylko nagrywali rozmowy do korpusu, ale też nadsyłali propozycje opisu
leksykograficznego słów nieopisanych do tej pory w słownikach
slangów. Korpus gromadzi oj 150 tys. słów w rozmowach (w tej chwili
zindeksowane w wyszukiwarce 80 tys.), 300 tys. słów z gazetek
szkolnych, blogów i pracach pisemnych uczniów oraz ponad milion słów
literatury młodzieżowej 2. połowy XX wieku jako korpus
porównawczy. Równocześnie z tworzeniem korpusu i słowniczka slangu w
ramach projektu przeprowadziliśmy w szkołach prezentację wykorzystania
NKJP w dydaktyce, a nauczyciele poloniści uczestniczący w projekcie
opracowali na podstawie NKJP 22 scenariuszy lekcji.

Wyszukiwarka to przerobiony przez Jarosława Strojka program Poliqarp z
interfejsem okienkowym wykorzystującym szkolne kategorie gramatyczne,
który oprócz tagów gramatycznych wprowadzanych przez tager TAKIPI,
dodatkowo umożliwia wyszukiwanie według danych socjologicznych: płci,
wieku, wykształcenia i konkretnej szkoły oraz nowych tagów
charakteryzujących poszczególne wyrazy slangowe.

Strona projektu: laboratoriumjezykowe.uw.edu.pl