Differences
This shows you the differences between two versions of the page.
— |
user:ptacek:rozklad-gen [2006/09/25 11:48] (current) |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ~~NOTOC~~ | ||
+ | v rámečku jsou moduly, které se na fázi podílejí | ||
+ | všechny fáze pracují na '' | ||
+ | (až na finální sestavení sekvence slov - :?:) | ||
+ | ---- | ||
+ | {{: | ||
+ | |||
+ | ====== translation - transfer ====== | ||
+ | * u překladu navíc adjectivize: | ||
+ | |||
+ | ====== preprocess ====== | ||
+ | Preprocess | ||
+ | NumeralsWrapper | ||
+ | |||
+ | * (sádlo), (máslo), (olej) -> (sádlo, máslo, olej) | ||
+ | * '' | ||
+ | * nastav '' | ||
+ | * correct_numbers | ||
+ | - číselná t-lemmata | ||
+ | - změna zavěšení :!: nepatri prilis do preprocessu, | ||
+ | |||
+ | ====== formémy ====== | ||
+ | prochází se do hloubky | ||
+ | Processing | ||
+ | Vallex | ||
+ | Diathesis | ||
+ | Derivation | ||
+ | |||
+ | * pro klauze (top-level a verba): setClauseType | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * pro VP: | ||
+ | * nastav fragment xml do '' | ||
+ | * normalizace framu - jen jeden (teď beru první) form pro functor a form type (kriteria pro výběr?) | ||
+ | * zvol diatezi '' | ||
+ | * B: base - ACT subjektem | ||
+ | * D1: PAT subjektem | ||
+ | * D2: PAT subjektem + být + participium trpné | ||
+ | * D3: má ustláno od | ||
+ | * uprav frame, aby odpovídal diatezi | ||
+ | * '' | ||
+ | * derivuj - nastav '' | ||
+ | * projdi děti: | ||
+ | * identifikuj agreement šipky | ||
+ | * nastav '' | ||
+ | * pro obecný člen: | ||
+ | * derivace pokud už neproběhla | ||
+ | * mám '' | ||
+ | * nastav fragment xml do '' | ||
+ | * normalizace framu - jen jeden (teď beru první) form pro functor a form type (kriteria pro výběr?) | ||
+ | * projdi děti: | ||
+ | * identifikuj agreement šipky | ||
+ | * nastav '' | ||
+ | |||
+ | ====== morfo kategorie ====== | ||
+ | Vallex | ||
+ | |||
+ | * realize_frame_elements (vybere jednu realizaci z framu a nastaví dětem morfo kategorie) | ||
+ | * m_case | ||
+ | * m_number | ||
+ | * m_negative | ||
+ | * pokud je v rámci určené i něco víc -> píšu rovnou do tagu | ||
+ | * nastaví '' | ||
+ | |||
+ | ====== agreement ====== | ||
+ | Agreement | ||
+ | Processing - hledání šipek | ||
+ | |||
+ | ====== compounds ====== | ||
+ | Compounds | ||
+ | |||
+ | předložky podle '' | ||
+ | složené slovesné tvary podle | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | pozor: spojky až později | ||
+ | |||
+ | ====== conjugation + declination ====== | ||
+ | Morphology | ||
+ | NumeralsWrapper | ||
+ | |||
+ | pro numerické se volá '' | ||
+ | * derivuje podle '' | ||
+ | * shoda uvnitř víceslovných číslených číslovek | ||
+ | * flexe | ||
+ | |||
+ | |||
+ | pro ostatní uzly | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | ====== první reorder ====== | ||
+ | PreReorder | ||
+ | |||
+ | * RSTR.adj pod n vlevo | ||
+ | * MANN.adj pod n vlevo | ||
+ | * complex RSTR.adj vpravo | ||
+ | * RSTR.v připojené pomocí vztažného '' | ||
+ | * lokace a časové určení pod n vpravo | ||
+ | * APP.n < | ||
+ | * EXT < | ||
+ | * REG.(not v) pod adj|adv vlevo | ||
+ | * DIFF.(not v) pod adj|adv vlevo | ||
+ | * CPR.v.(not inf) rodiče vpravo od děda | ||
+ | * ID vpravo | ||
+ | * adj/ | ||
+ | |||
+ | Reorder | ||
+ | |||
+ | * ty, co už mají nastavené příznaky, kde se tam ale vzaly :?: Processing :?: | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | ====== punctuation + spojky ====== | ||
+ | Processing2 | ||
+ | Connectors | ||
+ | |||
+ | průchod do hloubky | ||
+ | '' | ||
+ | zpracování sentencí, klauzí a obecných členů | ||
+ | pouze vytvoření seznamů levých konektorů - čárek a spojek | ||
+ | |||
+ | ====== druhý reorder ====== | ||
+ | druhý průchod do šířky mohl objednat dalsi presuny pro autosemanticke konektory doleva | ||
+ | příznak '' | ||
+ | |||
+ | ====== punctuation + spojky ====== | ||
+ | vyrobit uzly pro čárky a spojky | ||
+ | až po reordru, takže reorder nepřehazuje čárky | ||
+ | |||
+ | ====== reorder klitik ====== | ||
+ | až po spojkách, počítají se do pozic | ||
+ | |||
+ | ====== vokalizace ====== | ||
+ | |||
+ | ====== capitalization ====== | ||
+ | |||
+ | ====== sekvence slov ====== |