[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

user:ptacek:rozklad-gen [2006/09/25 11:48]
user:ptacek:rozklad-gen [2006/09/25 11:48] (current)
Line 1: Line 1:
 +~~NOTOC~~
 +v rámečku jsou moduly, které se na fázi podílejí
 +všechny fáze pracují na ''$sentRoot'' - potomek technického kořene
 +(až na finální sestavení sekvence slov - :?:)
 +----
  
 +{{:user:ptacek:faze1.png|na pocatku}}
 +
 +====== translation - transfer ======
 +  * u překladu navíc adjectivize: pták -> ptačí
 +
 +====== preprocess ======
 +  Preprocess
 +  NumeralsWrapper
 +
 +  * (sádlo), (máslo), (olej) -> (sádlo, máslo, olej)
 +  * ''undef($this->{tag})''
 +  * nastav ''$this->{ord}'' podle zobrazení v tredu
 +  * correct_numbers
 +    - číselná t-lemmata
 +    - změna zavěšení :!: nepatri prilis do preprocessu, pozdeji?
 +
 +====== formémy ======
 +prochází se do hloubky  
 +  Processing
 +  Vallex
 +  Diathesis
 +  Derivation
 +
 +  * pro klauze (top-level a verba): setClauseType
 +    * ''coap'': technické
 +    * ''nv-denom|vocat|partl'': neslovesné top-level
 +    * ''v-vn'': verbonominální
 +    * ''v-imp'': rozkazovací
 +    * ''v-compl'': func COMPL
 +    * ''v-pred'': ostatní
 +    * ''-'': infinitivy
 +  * pro VP:
 +    * nastav fragment xml do ''vallexFrame''
 +    * normalizace framu - jen jeden (teď beru první) form pro functor a form type (kriteria pro výběr?)
 +    * zvol diatezi ''setDiathesis''
 +      * B: base - ACT subjektem
 +      * D1: PAT subjektem
 +      * D2: PAT subjektem + být + participium trpné
 +      * D3: má ustláno od
 +    * uprav frame, aby odpovídal diatezi
 +    * ''Agreement::getSb($node)'' podle diateze
 +    * derivuj - nastav ''synPOS, m_lemma''
 +    * projdi děti:    
 +       * identifikuj agreement šipky
 +       * nastav ''frame_element'' - xml formy pro jeden functor
 +  * pro obecný člen:
 +    * derivace pokud už neproběhla
 +    * mám ''frame_element'' nebo dostanu default
 +    * nastav fragment xml do ''vallexFrame''
 +    * normalizace framu - jen jeden (teď beru první) form pro functor a form type (kriteria pro výběr?)
 +    * projdi děti:
 +       * identifikuj agreement šipky
 +       * nastav ''frame_element'' - xml formy pro jeden functor
 +
 +====== morfo kategorie ======
 +  Vallex
 +
 +  * realize_frame_elements (vybere jednu realizaci z framu a nastaví dětem morfo kategorie)
 +  * m_case
 +  * m_number
 +  * m_negative
 +  * pokud je v rámci určené i něco víc -> píšu rovnou do tagu
 +  * nastaví ''assigned_form'' - už jen jedna forma pro tento functor
 +
 +====== agreement ======
 +  Agreement
 +  Processing - hledání šipek
 +
 +====== compounds ======
 +  Compounds
 +
 +předložky podle ''assigned_form''
 +složené slovesné tvary podle 
 +  * ''isDiathesis()''
 +  * ''isTrTense()''
 +  * ''getDeontmod()''
 +  * ''getVerbmod()''
 +pozor: spojky až později
 +
 +====== conjugation + declination ======
 +  Morphology
 +  NumeralsWrapper
 +
 +pro numerické se volá ''assignNumForm()''
 +  * derivuje podle ''numerType''
 +  * shoda uvnitř víceslovných číslených číslovek
 +  * flexe
 +
 +
 +pro ostatní uzly
 +  * ''assignTag()''
 +  * ''assignForm()''
 +
 +====== první reorder ======
 +  PreReorder
 +
 +  * RSTR.adj pod n vlevo
 +  * MANN.adj pod n vlevo
 +  * complex RSTR.adj vpravo
 +  * RSTR.v připojené pomocí vztažného ''který'' vpravo
 +  * lokace a časové určení pod n vpravo
 +  * APP.n <latex>\neq</latex> ''#PersPron'' vpravo
 +  * EXT <latex>\neq</latex> ''n.quant'' <latex>\lor</latex> complex vlevo
 +  * REG.(not v) pod adj|adv vlevo
 +  * DIFF.(not v) pod adj|adv vlevo
 +  * CPR.v.(not inf) rodiče vpravo od děda
 +  * ID vpravo
 +  * adj/adv/n.pron.indef.inter vlevo za případné ''a/i/ale''
 +
 +  Reorder
 +
 +  * ty, co už mají nastavené příznaky, kde se tam ale vzaly :?: Processing :?:
 +    * ''reorderLeftLeftmostParent''
 +    * ''reorderRightLeftmostParent''
 +    * ''reorderRhem''
 +    * ''reorderCprLeftTo''
 +  * ''isPossessive()'' - vlevo před rodiče a rstr bratry
 +  * ''isGenitiveNoun()'' - ihned vpravo za rodiče
 +
 +====== punctuation + spojky ======
 +  Processing2
 +  Connectors
 +
 +průchod do hloubky
 +''$context'' obsahuje informace o pořadí uvnitř skupiny, případně carry bit - oddělit předchozí zleva 
 +zpracování sentencí, klauzí a obecných členů
 +pouze vytvoření seznamů levých konektorů - čárek a spojek
 +
 +====== druhý reorder ======
 +druhý průchod do šířky mohl objednat dalsi presuny pro autosemanticke konektory doleva
 +příznak ''reorderLeftLeftmostParent''
 +
 +====== punctuation + spojky ======
 +vyrobit uzly pro čárky a spojky
 +až po reordru, takže reorder nepřehazuje čárky
 +
 +====== reorder klitik ======
 +až po spojkách, počítají se do pozic
 +
 +====== vokalizace ======
 +
 +====== capitalization ======
 +
 +====== sekvence slov ======

[ Back to the navigation ] [ Back to the content ]