[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vladimir-rovensky [2008/04/07 19:10]
vladimir.rovensky
user:hladka:vladimir-rovensky [2008/09/29 14:47]
vladimir.rovensky
Line 1: Line 1:
-====== Zadání ====== +====== LGame ====== 
-   *[[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.doc|doc]] +[[external:LGame]] 
-   *[[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.pdf|pdf]]+ 
 + 
 + 
 + 
 +====== Dokumentace, data ====== 
 +   *Zadání ([[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.doc|doc]],  [[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.pdf|pdf]]
 +   * Specifikace [[http://ufal.mff.cuni.cz/~hladka/rp200809/Specifikace_V_Rovensky.pdf|pdf]] 
 +   * Dokumentace pilotní verze [[http://ufal.mff.cuni.cz/~hladka/rp200809/Dokumentace_V_Rovensky.pdf|pdf]] 
 +   * **Co vše má obsahovat pilotní verze?** 
 +      * **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou              metodologií. Rešerši zpracovat písemně v samostatném souboru. 
 +      * **Kód** S dostatečným počtem komentářů. 
 +      * **Dokumentace** 
 +         * **Uživatelská** - specifikace softwarových a hardwarových požadavků; konfigurace; popis instalace programu, spuštění programu, ukázky spuštění programu na souboru vět.  
 +         * **Programátorská** - popis struktury programu, implementační platformy (MS Windows, Linux, ...), použitých technologií, datových struktur, algoritmů a nestandartních knihoven. V programátorské dokumentaci má být to, co se nevyčte z komentářů v kódu.  
 +   * **Testovací data** Věty z Českého akademického korpusu 2.0 
 +         * Smysluplné věty [[http://ufal.mff.cuni.cz/~hladka/rp200809/devtest.ok|devtest.ok]] 
 +         * Nesmysluplné věty [[http://ufal.mff.cuni.cz/~hladka/rp200809/devtest.ko|devtest.ko]] 
 + 
  
 ====== Schůzky ====== ====== Schůzky ======
    * 3/3/2008    * 3/3/2008
 +   * **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)**
 +
  
  
Line 10: Line 30:
 ====== Vzkazy ======    ====== Vzkazy ======   
    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.
 +   * 27/5/2008 Nová verze morfologické analýzy, jakožto součást skriptu ''tool_chain'',  je nachystána ke [[http://ufal.mff.cuni.cz/~hladka/rp200809/morphology.zip|stažení]]. Jedná se přímo o obsah adresáře ''morphology/''.
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ====== Postup ====== ====== Postup ======
Line 15: Line 46:
   * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:22//)   * Smim ve vystupu tool-chainu pouzivat tagy <g> a <r> ? __Ne. To jsou informace pro syntax.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:22//)
   * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http://ufal.mff.cuni.cz/~hladka/rp200809/cz-appendix-D.pdf|zde]].__  (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:24//)   * Je nekde k dispozici cesky preklad tahaku ke znackam tagu <t>, pripadne vysvetlivky k nim ? __Ano - [[http://ufal.mff.cuni.cz/~hladka/rp200809/cz-appendix-D.pdf|zde]].__  (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:24//)
 +  * Pri uvodni schuzce se hovorilo o sade vet urcenych k testovani programu, da se nekde stahnout? __Ano, vety budou k dispozici. Budou to vety z Ceskeho akademickeho korpusu 2.0. Prace na tomto korpusu finisuje. Az se dodelaji vsechny kontroly, tak pripravim dva soubory ve formatu csts: jeden se smysluplnymi vetami a druhy s nesmysluplnymi vetami. Soubory budou k dispozici nejpozdeji pristi tyden ve stredu.__  --- //[[hladka@ufal.mff.cuni.cz|hladka]] 28.4.2008 20:53//
 +  * Co by mela splnovat specifikace programu(delka, format, obsah...)? __[[http://ufal.mff.cuni.cz/~hladka/rp200809/specifikace1.pdf|ukazka c. 1]],
 + [[http://ufal.mff.cuni.cz/~hladka/rp200809/Specifikace_verze3.pdf|ukazka c. 1]]__ --- //[[hladka@ufal.mff.cuni.cz|hladka]] 29.4.2008 10:29//
 +  * pri testovani ruznych vstupu jsem narazil na nektere hodnoty na pozici 2 morfologickeho tagu, ktere jsem nenasel v dokumentaci (konkretne hodnota 2), da se nekde sehnat aktualizovany popis znacek?
 +  * tool_chain spravne nerozeznava tvary sloves koncici na -li (budu-li, chcete-li)
 +
 ==Prvni naznak algoritmu== ==Prvni naznak algoritmu==
   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)
Line 40: Line 77:
   * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana.   * dodelal jsem zakladni sadu pravidel pro vztahy mezi slovnimi druhy, ta bude prubezne doplnovana.
   * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu.   * definovan format souboru pro ukladani techto vztahu(txt soubor pro jednoduchou editaci) - pri startu programu se z tohoto souboru nactou podminky pro vznik smysluplnych vztahu.
-  * Kod : zakladni struktura programu, parsovani vystupu tool_chainu, parsovani vyse zmineneho custom formatu, zjistovani platnosti podminek  +  * Kod : zakladni chodici verze 
- +  * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o) 
-==Dale== +  * rozsiren soubor s podminkami(aktualizovan i odkaz) 
-Nejdriv bych dotahl program do zakladni verze ktera bude implementovat vyse popsany algoritmuspotom s jeho pomoci prijde na radu pridavani a upravovani pravidel a celeho algoritmu :o), na konec detaily jako miliony optionu programu aby to vypadalo slozite, utilitu pro spravu souboru s podminkami aby to uzivatel nemusel psat rucne atp+  * par vystupu programu v jeho soucasne podobe je k nahlednuti [[http://www.ms.mff.cuni.cz/~rovev6am/vystupy.txt|zde]] ´= 
- += 2008/2009 = 
- +  * neustale rozsirovan soubor s podminkami 
- +  * pridana podpora davkoveho zpracovani 
- +  * pridany parametry pro spusteni programu - ignorovani nerozpoznanych tokenu, vyzadovani slovesa, minimalni delka vety atp. 
- +  * pridana utilita na editaci souboru s podminkami (java) 
- +  * pridana moznost vytvaret skupiny podminek, ktere jsou ve smysluplne vete vyzadovany 
- +  * pridan treshold na pocet iteraci procedury kontrolujici podminky typu (3) - zajisteni polynomialni slozitosti
  
 +== Dale ==
 +**22/9/08**
 +   * vypisovani kolizi
 +   * SENSE jako webova aplikace
 +   * PREZENTACE
 +      * slides
 +      * formulace ulohy
 +      * smysluplnost vzhledem  k cemu - zde vzhledem k morfologicke urovni zpracovani
 +      * vstupni data - tool_chain (CAK 2.0)
 +      * algoritmus - vyvojovy diagram
 +      * vypocetni slozitost
 +      * evaluace - data od Seznamu, 'nase' data (CAk 2.0)
 +      * ukazka
 +      * 13. rijna nanecisto
  
 ====== Otázky ======   ====== Otázky ======  
Line 58: Line 108:
   * tool_chain nebyl tak hrozny, spis me trvalo nainstalovat linux a btred, jsem z windowsu zvykly vsechno instalovat na dve kliknuti a najednou to po me chce kompilator cecka a cosi linkovat a konfigurovat a vubec. To je jako kdybych si chtel koupit grafickou kartu a dosal pul kila kremiku a pajku. Ale aspon jsem se naucil neco noveho.   * tool_chain nebyl tak hrozny, spis me trvalo nainstalovat linux a btred, jsem z windowsu zvykly vsechno instalovat na dve kliknuti a najednou to po me chce kompilator cecka a cosi linkovat a konfigurovat a vubec. To je jako kdybych si chtel koupit grafickou kartu a dosal pul kila kremiku a pajku. Ale aspon jsem se naucil neco noveho.
 - Můžete prosím na wiki zveřejnit tu sadu pravidel, kterou jste sestavil?  --- //[[hladka@ufal.mff.cuni.cz|hladka]] 06.4.2008 21:06// - Můžete prosím na wiki zveřejnit tu sadu pravidel, kterou jste sestavil?  --- //[[hladka@ufal.mff.cuni.cz|hladka]] 06.4.2008 21:06//
-  * mam to napsane na papire, prepisu to rovnou do toho formatu a uploadnu to sem hned jak to budu mit+  * mam to napsane na papire, prepisu to rovnou do toho formatu a uploadnu to sem hned jak to budu mit. Predbezna verze souboru je [[http://www.ms.mff.cuni.cz/~rovev6am/conditions.txt|Tady]]. Bude hojne rozsirovana :o)

[ Back to the navigation ] [ Back to the content ]