Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:vladimir-rovensky [2008/04/06 20:59] hladka |
user:hladka:vladimir-rovensky [2008/05/27 12:22] hladka |
||
---|---|---|---|
Line 2: | Line 2: | ||
| | ||
| | ||
+ | * **Co vše má obsahovat pilotní verze?** | ||
+ | * **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou metodologií. Rešerši zpracovat písemně v samostatném souboru. | ||
+ | * **Kód** S dostatečným počtem komentářů. | ||
+ | * **Dokumentace** | ||
+ | * **Uživatelská** - specifikace softwarových a hardwarových požadavků; | ||
+ | * **Programátorská** - popis struktury programu, implementační platformy (MS Windows, Linux, ...), použitých technologií, | ||
+ | * **Testovací data** Věty z Českého akademického korpusu 2.0 | ||
+ | * Smysluplné věty [[http:// | ||
+ | * Nesmysluplné věty [[http:// | ||
+ | |||
+ | |||
====== Schůzky ====== | ====== Schůzky ====== | ||
* 3/3/2008 | * 3/3/2008 | ||
+ | * **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)** | ||
+ | |||
Line 10: | Line 23: | ||
====== Vzkazy ====== | ====== Vzkazy ====== | ||
* 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | ||
+ | * 27/5/2008 Nová verze morfologické analýzy, jakožto součást skriptu '' | ||
+ | |||
+ | |||
Line 21: | Line 37: | ||
* Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (// | * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (// | ||
* Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http:// | * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http:// | ||
+ | * Pri uvodni schuzce se hovorilo o sade vet urcenych k testovani programu, da se nekde stahnout? __Ano, vety budou k dispozici. Budou to vety z Ceskeho akademickeho korpusu 2.0. Prace na tomto korpusu finisuje. Az se dodelaji vsechny kontroly, tak pripravim dva soubory ve formatu csts: jeden se smysluplnymi vetami a druhy s nesmysluplnymi vetami. Soubory budou k dispozici nejpozdeji pristi tyden ve stredu.__ | ||
+ | * Co by mela splnovat specifikace programu(delka, | ||
+ | | ||
==Prvni naznak algoritmu== | ==Prvni naznak algoritmu== | ||
- Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | ||
Line 46: | Line 65: | ||
* dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana. | * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana. | ||
* definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu. | * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu. | ||
- | * Kod : zakladni | + | * Kod : zakladni |
+ | * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o) | ||
+ | * rozsiren soubor s podminkami(aktualizovan i odkaz) | ||
+ | * par vystupu | ||
==Dale== | ==Dale== | ||
- | Nejdriv bych dotahl | + | Vymyslet zapojeni spojek, castic, citoslovci, pripadne podrobnejsi rozdeleni vety na casti (podmetna, prisudkova, |
+ | Zda se ze smysluplnost | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Otázky ====== | ||
+ | - Jak moc bolestné bylo rozchodit | ||
+ | * tool_chain nebyl tak hrozny, spis me trvalo nainstalovat linux a btred, jsem z windowsu zvykly vsechno instalovat | ||
+ | - Můžete prosím na wiki zveřejnit tu sadu pravidel, kterou jste sestavil? | ||
+ | * mam to napsane na papire, prepisu |