[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vladimir-rovensky [2008/04/06 19:24]
vladimir.rovensky
user:hladka:vladimir-rovensky [2008/04/06 21:05]
hladka
Line 10: Line 10:
 ====== Vzkazy ======    ====== Vzkazy ======   
    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.
- 
- 
- 
- 
- 
  
 ====== Postup ====== ====== Postup ======
Line 22: Line 17:
 ==Prvni naznak algoritmu== ==Prvni naznak algoritmu==
   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)
-  Oprava: Ve vystupu tool_chainu najit tag <s> pro vetu a nasledne vybirat tagy <f>, resp <d> pro tokeny, v nich z <MDl> vybrat lemma, z <MDt> tagy.+  Oprava: Ve vystupu tool_chainu najit tag <s> pro vetu a nasledne vybirat tagy <f>, resp <d> pro tokeny, v nich z <MDl> vybrat lemma, z <MDt> tagy. __Ano, pochopil jste strukturu vystupu spravne.__ --- //[[hladka@ufal.mff.cuni.cz|hladka]] 06.4.2008 20:58//
   - Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/spojek/predlozek... ty rozdeli souveti na nekolik casti, ty casti jez obsahuji sloveso jsou vety jednoduche. __Muze byt.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:31//)   - Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/spojek/predlozek... ty rozdeli souveti na nekolik casti, ty casti jez obsahuji sloveso jsou vety jednoduche. __Muze byt.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:31//)
   - Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, ktere by se nejspis daly implementovat:   - Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, ktere by se nejspis daly implementovat:
Line 46: Line 41:
   * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu.   * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu.
   * Kod : zakladni struktura programu, parsovani vystupu tool_chainu, parsovani vyse zmineneho custom formatu, zjistovani platnosti podminek    * Kod : zakladni struktura programu, parsovani vystupu tool_chainu, parsovani vyse zmineneho custom formatu, zjistovani platnosti podminek 
 +
 +==Dale==
 +Nejdriv bych dotahl program do zakladni verze ktera bude implementovat vyse popsany algoritmus, potom s jeho pomoci prijde na radu pridavani a upravovani pravidel a celeho algoritmu :o), na konec detaily jako miliony optionu programu aby to vypadalo slozite, utilitu pro spravu souboru s podminkami aby to uzivatel nemusel psat rucne atp.
 +
 +
 +
 +
 +
 +
 +====== Otázky ======  
 +- Jak moc bolestné bylo rozchodit a spustit ''tool_chain''. --- //[[hladka@ufal.mff.cuni.cz|hladka]] 06.4.2008 21:04//
 +

[ Back to the navigation ] [ Back to the content ]