Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
external:pcedt:ar [2008/06/11 09:08] mikulova |
external:pcedt:ar [2009/05/11 16:30] (current) mikulova |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Analytická rovina PCEDT_cz ====== | ====== Analytická rovina PCEDT_cz ====== | ||
+ | V projektu PCEDT_cz se manuálně anotuje až tektogramatická rovina, analytická rovina byla vytvořena pouze automatickými nástroji. Předpokládáme, | ||
+ | |||
+ | Anotace byla provedena v červnu a v červenci 2008 anotátorkou Ivanou Klímovou. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Data ===== | ||
+ | Manuální anotace bude provedena na cca 2 000 větách, které budou vybrány ze souborů wsj22* a výše. | ||
+ | Přednostně jsou vybírány soubory, které prošly revizí překladu a kterým již existuje manuální tektogramatická anotace. | ||
+ | |||
+ | PML-schéma anotovaných souborů je upraveno tak, aby bylo možné k uzlům vkládat anotátorské poznámky. | ||
+ | Do souborů, ke kterým již existuje tektogramatická anotace, jsou k odpovídajícím a-uzlům z t-roviny přeneseny následující anotátorské poznámky: | ||
+ | * M-lemma | ||
+ | * M-tag | ||
+ | * Typo | ||
+ | * Word segmentation | ||
+ | * Sentence segmentation | ||
+ | * Translation | ||
+ | * Re-generate | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== TrEd ===== | ||
+ | Contex: '' | ||
+ | Style: '' | ||
+ | Při anotaci se používají stejná anotační makra jako při analytické anotaci korpusu ČAK. | ||
+ | Navíc jsou dvě makra pro anotaci anotátorských poznámek: | ||
+ | * Vytvoření poznámky: **!** | ||
+ | * Editace poznámky: **?** | ||
+ | Pro kontrolu překladu je v TrEdu zobrazena vedle českého překladu také originální anglická věta. | ||
+ | |||
+ | |||
+ | |||
+ | ===== Pravidla anotace ===== | ||
+ | * [[http:// | ||
+ | * Dodatky k manuálu: | ||
+ | * {{: | ||
+ | * {{: | ||
+ | * {{: | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||