Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
external:pcedt:ar [2008/06/11 11:48] mikulova |
external:pcedt:ar [2008/06/11 11:56] mikulova |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Analytická rovina PCEDT_cz ====== | ====== Analytická rovina PCEDT_cz ====== | ||
V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, | V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, | ||
+ | |||
+ | |||
Line 6: | Line 8: | ||
Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše. | Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše. | ||
Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace. | Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace. | ||
+ | |||
+ | PML-schéma anotovaných souborů je upraveno tak, aby bylo možné k uzlům vkládat anotátorské poznámky. | ||
+ | Do souborů, ke kterým již existuje tektogramatická anotace, jsou k odpovídajícím a-uzlům z t-roviny přeneseny následující anotátorské poznámky: | ||
+ | * M-lemma | ||
+ | * M-tag | ||
+ | * Typo | ||
+ | * Word segmentation | ||
+ | * Sentence segmentation | ||
+ | * Translation | ||
+ | * Re-generate | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||