Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:vladimir-rovensky [2008/03/23 19:36] vladimir.rovensky |
user:hladka:vladimir-rovensky [2008/04/06 21:04] hladka |
||
---|---|---|---|
Line 5: | Line 5: | ||
====== Schůzky ====== | ====== Schůzky ====== | ||
* 3/3/2008 | * 3/3/2008 | ||
+ | |||
Line 10: | Line 11: | ||
* 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | ||
+ | ====== Postup ====== | ||
==Nejasnosti== | ==Nejasnosti== | ||
- | * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? | + | * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (// |
- | * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? | + | * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http:// |
==Prvni naznak algoritmu== | ==Prvni naznak algoritmu== | ||
- | - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. | + | - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. |
- | - Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/ | + | Oprava: Ve vystupu tool_chainu najit tag <s> pro vetu a nasledne vybirat tagy <f>, resp <d> pro tokeny, v nich z <MDl> vybrat lemma, z <MDt> tagy. __Ano, pochopil jste strukturu vystupu spravne.__ --- // |
+ | - Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/ | ||
- Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, | - Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, | ||
* korektni vztahy mezi slovy - bylo by mozne definovat pro kazdou dvojici slovnich druhu podminky(=hodnoty v tagu <t>), ktere musi byt splneny, aby tato dvojice davala smysl. Napr. pro podstatna a pridavna jmena nejak takhle: | * korektni vztahy mezi slovy - bylo by mozne definovat pro kazdou dvojici slovnich druhu podminky(=hodnoty v tagu <t>), ktere musi byt splneny, aby tato dvojice davala smysl. Napr. pro podstatna a pridavna jmena nejak takhle: | ||
Line 30: | Line 33: | ||
== Priklad == | == Priklad == | ||
Mame vetu "Pokud si chcete něco pouze vyzkoušet, použijte | Mame vetu "Pokud si chcete něco pouze vyzkoušet, použijte | ||
- | pískoviště." | + | pískoviště." |
+ | |||
+ | ==Hotovo== | ||
+ | * zaklad algoritmu | ||
+ | * konecne se mi povedlo nainstalovat linux, tool_chain i vsechno ostatni potrebne, takze uz vim co parsovat - prislusna sekce postupu(vyse) upravena. Za odmenu jsem si zahral miny. | ||
+ | * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana. | ||
+ | * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu. | ||
+ | * Kod : zakladni struktura programu, parsovani vystupu tool_chainu, | ||
+ | |||
+ | ==Dale== | ||
+ | Nejdriv bych dotahl program do zakladni verze ktera bude implementovat vyse popsany algoritmus, potom s jeho pomoci prijde na radu pridavani a upravovani pravidel a celeho algoritmu :o), na konec detaily jako miliony optionu programu aby to vypadalo slozite, utilitu pro spravu souboru s podminkami aby to uzivatel nemusel psat rucne atp. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Otazky ====== | ||
+ | - Jak moc bolestne bylo rozchodit a spustit '' |