[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vladimir-rovensky [2008/05/27 11:11]
hladka
user:hladka:vladimir-rovensky [2008/09/29 14:47]
vladimir.rovensky
Line 1: Line 1:
-====== Zadání ====== +====== LGame ====== 
-   *[[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.doc|doc]] +[[external:LGame]] 
-   *[[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.pdf|pdf]]+ 
 + 
 + 
 + 
 +====== Dokumentace, data ====== 
 +   *Zadání ([[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.doc|doc]],  [[http://ufal.mff.cuni.cz/~hladka/rp200809/rp-VladimirRovensky-zadani.pdf|pdf]]) 
 +   * Specifikace [[http://ufal.mff.cuni.cz/~hladka/rp200809/Specifikace_V_Rovensky.pdf|pdf]] 
 +   * Dokumentace pilotní verze [[http://ufal.mff.cuni.cz/~hladka/rp200809/Dokumentace_V_Rovensky.pdf|pdf]]
    * **Co vše má obsahovat pilotní verze?**    * **Co vše má obsahovat pilotní verze?**
       * **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou              metodologií. Rešerši zpracovat písemně v samostatném souboru.       * **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou              metodologií. Rešerši zpracovat písemně v samostatném souboru.
-      * **Kód** S dostatečným počtem komenátřů.+      * **Kód** S dostatečným počtem komentářů.
       * **Dokumentace**       * **Dokumentace**
          * **Uživatelská** - specifikace softwarových a hardwarových požadavků; konfigurace; popis instalace programu, spuštění programu, ukázky spuštění programu na souboru vět.           * **Uživatelská** - specifikace softwarových a hardwarových požadavků; konfigurace; popis instalace programu, spuštění programu, ukázky spuštění programu na souboru vět. 
-         * **Programátorská** - popis struktury programu, implementační platformy, použitých technologií, datových struktur, algoritmů a nestandartních knihoven. V programátorské dokumentaci má být to, co se nevyčte z komentářů v kódu. +         * **Programátorská** - popis struktury programu, implementační platformy (MS Windows, Linux, ...), použitých technologií, datových struktur, algoritmů a nestandartních knihoven. V programátorské dokumentaci má být to, co se nevyčte z komentářů v kódu.  
 +   * **Testovací data** Věty z Českého akademického korpusu 2.0 
 +         * Smysluplné věty [[http://ufal.mff.cuni.cz/~hladka/rp200809/devtest.ok|devtest.ok]] 
 +         * Nesmysluplné věty [[http://ufal.mff.cuni.cz/~hladka/rp200809/devtest.ko|devtest.ko]]
  
  
Line 14: Line 24:
    * 3/3/2008    * 3/3/2008
    * **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)**    * **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)**
 +
  
  
Line 19: Line 30:
 ====== Vzkazy ======    ====== Vzkazy ======   
    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.    * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek.
-   * 27/5/2008 Nová verze morfologické analýzy, jakožto součást skriptu ''tool_chain''  je nachystána ke [[http://ufal.mff.cuni.cz/~hladka/rp200809/morphology.zip|stažení]]. Jedná se přímo o obsah adresáře ''morphology/''.+   * 27/5/2008 Nová verze morfologické analýzy, jakožto součást skriptu ''tool_chain'' je nachystána ke [[http://ufal.mff.cuni.cz/~hladka/rp200809/morphology.zip|stažení]]. Jedná se přímo o obsah adresáře ''morphology/''. 
 + 
  
  
Line 36: Line 49:
   * Co by mela splnovat specifikace programu(delka, format, obsah...)? __[[http://ufal.mff.cuni.cz/~hladka/rp200809/specifikace1.pdf|ukazka c. 1]],   * Co by mela splnovat specifikace programu(delka, format, obsah...)? __[[http://ufal.mff.cuni.cz/~hladka/rp200809/specifikace1.pdf|ukazka c. 1]],
  [[http://ufal.mff.cuni.cz/~hladka/rp200809/Specifikace_verze3.pdf|ukazka c. 1]]__ --- //[[hladka@ufal.mff.cuni.cz|hladka]] 29.4.2008 10:29//  [[http://ufal.mff.cuni.cz/~hladka/rp200809/Specifikace_verze3.pdf|ukazka c. 1]]__ --- //[[hladka@ufal.mff.cuni.cz|hladka]] 29.4.2008 10:29//
 +  * pri testovani ruznych vstupu jsem narazil na nektere hodnoty na pozici 2 morfologickeho tagu, ktere jsem nenasel v dokumentaci (konkretne hodnota 2), da se nekde sehnat aktualizovany popis znacek?
 +  * tool_chain spravne nerozeznava tvary sloves koncici na -li (budu-li, chcete-li)
 +
 ==Prvni naznak algoritmu== ==Prvni naznak algoritmu==
   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)   - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu <MDt>, tj., vystup automaticke procedury.__ (//[[hladka@ufal.mff.cuni.cz|hladka]] 25.3.2008 09:25//)
Line 64: Line 80:
   * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o)   * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o)
   * rozsiren soubor s podminkami(aktualizovan i odkaz)   * rozsiren soubor s podminkami(aktualizovan i odkaz)
-  * par vystupu programu v jeho soucasne podobe je k nahlednuti [[http://www.ms.mff.cuni.cz/~rovev6am/vystupy.txt|zde]] +  * par vystupu programu v jeho soucasne podobe je k nahlednuti [[http://www.ms.mff.cuni.cz/~rovev6am/vystupy.txt|zde]] ´= 
- +2008/2009 
-==Dale== +  * neustale rozsirovan soubor s podminkami 
-Vymyslet zapojeni spojekcasticcitoslovci, pripadne podrobnejsi rozdeleni vety na casti (podmetna, prisudkova,...), ktere musi tvorit souvisle komponenty -> cela veta nemusi byt nutne souvisla. Vypada to ze by se to mohlo hodit, napr. sloveso jde tezko napojit na podmetjen za pomoci doud definovanych podminek, vyjde z toho prazdna podminka a to je dost obecne. +  * pridana podpora davkoveho zpracovani 
-Zda se ze smysluplnost program vetsinou rozezna, trochu horsi je to s nesmyslnymi vetami domyslim. +  * pridany parametry pro spusteni programu - ignorovani nerozpoznanych tokenuvyzadovani slovesaminimalni delka vety atp. 
- +  * pridana utilita na editaci souboru s podminkami (java) 
- +  * pridana moznost vytvaret skupiny podminek, ktere jsou ve smysluplne vete vyzadovany 
- +  * pridan treshold na pocet iteraci procedury kontrolujici podminky typu (3) zajisteni polynomialni slozitosti
- +
- +
- +
- +
  
 +== Dale ==
 +**22/9/08**
 +   * vypisovani kolizi
 +   * SENSE jako webova aplikace
 +   * PREZENTACE
 +      * slides
 +      * formulace ulohy
 +      * smysluplnost vzhledem  k cemu - zde vzhledem k morfologicke urovni zpracovani
 +      * vstupni data - tool_chain (CAK 2.0)
 +      * algoritmus - vyvojovy diagram
 +      * vypocetni slozitost
 +      * evaluace - data od Seznamu, 'nase' data (CAk 2.0)
 +      * ukazka
 +      * 13. rijna nanecisto
  
 ====== Otázky ======   ====== Otázky ======  

[ Back to the navigation ] [ Back to the content ]