Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:vladimir-rovensky [2008/04/06 19:15] vladimir.rovensky |
user:hladka:vladimir-rovensky [2008/04/28 20:57] hladka |
||
---|---|---|---|
Line 20: | Line 20: | ||
* Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (// | * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (// | ||
* Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http:// | * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http:// | ||
+ | * Pri uvodni schuzce se hovorilo o sade vet urcenych k testovani programu, da se nekde stahnout? __Ano, vety budou k dispozici. Budou to vety z Ceskeho akademickeho korpusu 2.0. Prace na tomto korpusu finisuje. Az se dodelaji vsechny kontroly, tak pripravim dva soubory ve formatu csts: jeden se smysluplnymi vetami a druhy s nesmysluplnymi vetami.__ | ||
+ | * Co by mela splnovat specifikace programu(delka, | ||
==Prvni naznak algoritmu== | ==Prvni naznak algoritmu== | ||
- Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | ||
- | Oprava: Ve vystupu tool_chainu najit tag <s> pro vetu a nasledne vybirat tagy <f>, resp <d> pro tokeny, v nich z <MDl> vybrat lemma, z <MDt> tagy. | + | Oprava: Ve vystupu tool_chainu najit tag <s> pro vetu a nasledne vybirat tagy <f>, resp <d> pro tokeny, v nich z <MDl> vybrat lemma, z <MDt> tagy. __Ano, pochopil jste strukturu vystupu spravne.__ --- // |
- Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/ | - Pokud je veta souvetim, rozdelit na hole vety, cele souveti je smysluplne, pokud jsou smysluplne vsechny hole vety v nem obsazene. Rozdelovani realizovat napr. vyhledanim interpunkce/ | ||
- Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, | - Dale analyza pouze jednoduche vety. Napadly me dve veci ovlivnujici smysluplnost, | ||
Line 42: | Line 44: | ||
==Hotovo== | ==Hotovo== | ||
* zaklad algoritmu | * zaklad algoritmu | ||
- | * konecne se mi povedlo nainstalovat linux, tool_chain i vsechno ostatni potrebne, takze uz vim co parsovat. Za odmenu jsem si zahral miny. | + | * konecne se mi povedlo nainstalovat linux, tool_chain i vsechno ostatni potrebne, takze uz vim co parsovat |
- | * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana | + | * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana. |
- | * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) | + | * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) |
- | * Kod : zakladni | + | * Kod : zakladni |
+ | * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o) | ||
+ | * rozsiren soubor s podminkami(aktualizovan i odkaz) | ||
+ | * par vystupu | ||
+ | |||
+ | ==Dale== | ||
+ | Vymyslet zapojeni spojek, castic, citoslovci, pripadne podrobnejsi rozdeleni vety na casti (podmetna, prisudkova, | ||
+ | Zda se ze smysluplnost program vetsinou rozezna, trochu horsi je to s nesmyslnymi vetami - domyslim. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Otázky ====== | ||
+ | - Jak moc bolestné bylo rozchodit a spustit '' | ||
+ | * tool_chain nebyl tak hrozny, spis me trvalo nainstalovat linux a btred, jsem z windowsu zvykly vsechno instalovat na dve kliknuti a najednou to po me chce kompilator cecka a cosi linkovat a konfigurovat a vubec. To je jako kdybych si chtel koupit grafickou kartu a dosal pul kila kremiku a pajku. Ale aspon jsem se naucil neco noveho. | ||
+ | - Můžete prosím na wiki zveřejnit tu sadu pravidel, kterou jste sestavil? | ||
+ | * mam to napsane na papire, prepisu to rovnou do toho formatu a uploadnu to sem hned jak to budu mit. Predbezna verze souboru je [[http:// |