AUTOR:     Szymon Bemowski
AFILIACJA: IPI PAN / Uniwersytet Warszawski
TYTUŁ:     Schemat kodowania dla korpusów z wieloma poziomami anotacji
           lingwistycznej zgodny ze standardem TEI

STRESZCZENIE:

Referat będzie stanowił prezentację nowego schematu kodowania dla
korpusów językowych z wielopoziomową anotacją lingwistyczną. Schemat
został opracowany na potrzeby korpusu NKJP, ale może być
wykorzystywany w dowolnym projekcie korpusowym. Obejmuje następujące
poziomy anotacji: czysty tekst, segmentacja, struktura, anotacja
morfosyntaktyczna, wyrazy składniowe, anotacja składniowa, byty
nazwane oraz anotacja sensami słów. Ponadto pozwala na wyrażanie
zjawisk takich jak nieciągłość, zagnieżdżenie czy alternatywa. Jest
zgodny ze standardem TEI.

Każdy poziom anotacji oraz zależności między poziomami będą omówione i
zilustrowane przykładami. Ponadto schemat zostanie porównany do
istniejących standardów kodowania korpusów.