This is an old revision of the document!
Data k úlohám z počítačového zpracování přirozeného jazyka
- Háčkování: tokenizovaný text s diakritikou
- Hranice slov a vět: tokenizovaný text s vyznačenými hranicemi odstavců a vět
- Morfologická analýza: tokenizovaný text, token = slovo/lemma/značka
- Tagging: tokenizovaný text, token = slovo/značka
- Parsing: sloupcový formát CoNLL