AUTOR: Szymon Bemowski AFILIACJA: IPI PAN / Uniwersytet Warszawski TYTUŁ: Schemat kodowania dla korpusów z wieloma poziomami anotacji lingwistycznej zgodny ze standardem TEI STRESZCZENIE: Referat będzie stanowił prezentację nowego schematu kodowania dla korpusów językowych z wielopoziomową anotacją lingwistyczną. Schemat został opracowany na potrzeby korpusu NKJP, ale może być wykorzystywany w dowolnym projekcie korpusowym. Obejmuje następujące poziomy anotacji: czysty tekst, segmentacja, struktura, anotacja morfosyntaktyczna, wyrazy składniowe, anotacja składniowa, byty nazwane oraz anotacja sensami słów. Ponadto pozwala na wyrażanie zjawisk takich jak nieciągłość, zagnieżdżenie czy alternatywa. Jest zgodny ze standardem TEI. Każdy poziom anotacji oraz zależności między poziomami będą omówione i zilustrowane przykładami. Ponadto schemat zostanie porównany do istniejących standardów kodowania korpusów.