[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:morpho_gen [2011/09/29 14:20]
dusek
user:dusek:morpho_gen [2011/10/03 16:59]
dusek
Line 1: Line 1:
-==== Generování morfologických atributů z formémů a gramatémů ====+==== Generování morfologických atributů z formémů a gramatémů (návrh) ====
  
 === Postup === === Postup ===
   * Nejdřív určit MainPOS a SubPOS, podle toho se budou určovat další featury   * Nejdřív určit MainPOS a SubPOS, podle toho se budou určovat další featury
   * Určit i Lemma, na základě zdrojového lemmatu (důležité hlavně pro #PersPron, ale i possesiva nebo cokoliv by se sbalovalo na t-rovině)   * Určit i Lemma, na základě zdrojového lemmatu (důležité hlavně pro #PersPron, ale i possesiva nebo cokoliv by se sbalovalo na t-rovině)
 +    * lemma se mění na t-rovině u: #PersPron, possesiv, (číslovek, deadjektivních adverbií, neurčitých zájmen -- jen opravdová, ne automatická)
   * něco obecnějšího na složené slovesné formy   * něco obecnějšího na složené slovesné formy
 +    * do autom. skládání stromu z formémů (až po vygenerování všech funkcí)
 +    * možná mít celou složenou formu jako celek a dávat jí nejdřív jeden tag (-- včetně modálů? asi by vlastně nebyl problém)
 +    * Získání složených slovesných forem (asi by šlo i na a-rovině):
 +
 +  t-node [ 1+x a/aux.rf a-node [ m/tag ~ '^V' ], a/lex.rf a-node [ m/tag ~ '^V' ] ];
  
 === Modely === === Modely ===
   * Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava   * Jeden model na všechny POSy? Spíš asi dělené, na různá políčka různý, určování zleva doprava
 +    * časem může být použit interset
 +  * nejprve doplnit konstantní vlastnosti, potom určování ostatních i na základně nich
 +  * zřejmě dva bloky -- jeden pro určení slovního druhu a doplnění konstant, druhý pro určení jednotlivých morfologických hodnot
  
 === POSy a generované věci === === POSy a generované věci ===
   * drop -- přidá se k vyhození, negeneruje se nic   * drop -- přidá se k vyhození, negeneruje se nic
-  * +  * substantiva: jen číslo a negace (pád z formému, rod ze slovníku) 
 +  * adjektiva: číslo, negace, rod, pád (pokud není dán z formému) 
 +  * zájmena: číslo, negace, rod, pád (není-li dán z formému), possesivnost (v určení lemmatu? -- //svůj// apod.) 
 +  * číslovky: pád (není-li z formému) 
 +    * možná až potom dát ReverseNounNumberDependendency, aby to nedělalo bordel
  
 === Potřebné featury === === Potřebné featury ===
 +  * IsSubject -- MarkSubject, featury od subjectu //pro agreement, hl. sloves, ale i adjektivních komplementů//
 +  * z+2, featury od toho, co na tom visí //pro adjektiva: "každý z mužů, každá z žen"//
 +  * Koreference (gramatická) //pro "který", vztažná zájmena//
 +  * rodič a jeho featury //pro adjektiva: governors gender//
  
 === Zůstává ruční / původní === === Zůstává ruční / původní ===
   * Reflexiva tantum, Subconjs, DropSubjPersProns (?),  MoveCliticsToWackernagel, Expletiva (?)   * Reflexiva tantum, Subconjs, DropSubjPersProns (?),  MoveCliticsToWackernagel, Expletiva (?)
   * AddPrepos, AddParentheses, AddPunctuation -- hodně obecné, asi by se dalo generaliozvat!   * AddPrepos, AddParentheses, AddPunctuation -- hodně obecné, asi by se dalo generaliozvat!
 +  * GenerateWordForms -- nutné pročistit, je v tom bordel

[ Back to the navigation ] [ Back to the content ]