[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vincent-kriz [2009/02/12 11:37]
vincent.kriz Doplnil som informacie z povodnej Wiki stranky
user:hladka:vincent-kriz [2009/05/10 21:31]
hladka
Line 16: Line 16:
    * 20/05/2009 - odovzdanie bakalárskej práce    * 20/05/2009 - odovzdanie bakalárskej práce
  
-====== Výstup tool_chainu, definovanie zmysluplnosti ====== + 
-   Nainštaloval som si novú verziu tool_chainu a vyskúšal aj ďalšie nástroje z ČAK 2.0Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzyV bakalárskej práci budem využívať (a parsovaťtieto tagy+====== Stretnutia ====== 
-      * <t> morfologická značka (czech positional morphological system tag+   Mohli by sme sa stretnúť v __pondelok, 09.05.2009__?  
-      * <A> syntaktická značka (popísaná Sprievodcovi ČAK 2.0) +      * 95. uz bylo v sobotu, ale pocitam se setkanim v pondeli 11.;-)
-      * <r> pozícia slova vo vete (vyjadrujúca slovosled+   * Čo by som chcel prebrať
-      * <g> odkaz na nadradené slovo +      * Predstavenie a ukazka aplikacie SyMorAn (prinesiem notebook) 
-   Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosťZatiaľ mám pocitže by sa nemusela príliš líšiť od našej "morfologickej" zmysluplnosti ešte stále nemáme k dispozícii slovo ako také (jeho významale namiesto neho zavedieme objektktorý bude charakterizovaný vyššie spomenutými značkamiVeta bude mať zmyselak v nej neobjavíme žiaden protiklad s navrhnutými morfologicko-syntaktickými pravidlami.+         * prepinace 
 +         * 3 mody vystupu 
 +         * morfologicke moduly 
 +         * syntakticky modul 
 +         * 4 urovne chyb 
 +         * zaverecna statistika 
 +      * Diskusia nad textom prace 
 +      * Predstavenie webovej stranky (ak ju to pondelka stihnem napisat) 
 + 
 + 
 +====== Text bakalarky ====== 
 +   * Mozete sem, prosim, napisat ako maju vyzerat zaznamy Literature - jednak na webove stranky a jednak na Sprievodcu CAK 2.0 
 +      *   \bibitem[Vidová Hladká, 2008]{hladka:2008} Vidová Hladká Barbora, Jan Hajiè, Jiøí Hana, Jaroslava Hlaváèová, Jiøí Mírovský, Jan Raab. Czech Academic Corpus 2.0. CD-ROM, ISBN: 1-58563-491-3. Linguistic Data Consortium, cat. num.: LDC2008T22, Philadelphia, Pennsylvania, USA, 2008. 
 +      * \bibitem[CAC 2.0, 2008]{cac:2008} Czech Academic Corpus 2.0 on-line. \tt{http://ufal.mff.cuni.cz/rest/cac/cac\_20.html} 
 + 
 +   * Zoznam obrazkov a tabuliek mam vlozit na zaciatok prace (za obsah), na koniec (za literaturu) alebo na uplny koniec (za prilohy)? 
 +      * Za obsah. 
 +      * Literatura je na konci textu pred prilohami. 
 + 
 +   Praca obsahuje 2 dodatky - morfologicke tabulky a popis CD-ROM 
 +      * DobreTo mate popis morfologickych znacek jako latexovskou tabulku? 
 +   * Privitam akekolvek navrhy/napady na zlepsenie textu :))) 
 +      * Peclive jsem precetla prvni verzikterou jste mi poslal. K te druhe jsem se nedostala, castecne zamerne. Projedeme tu prvni a uvidite;-)) 
 +   * Mam do Uvodu napisat presne zadanie prace (z SISu)
 +      * Myslimze to neni nutneAbstrakt slovensky a cesky staci. 
 + 
 + 
 +====== Testovacie udaje ====== 
 +   * Dev-suboryktore ste mi poslala som nevedel spracovat tool_chainom (nevedel som spustit parser), preto som zo suboru vybral cisty text viet a znovu ich prehnal tool_chainom. Tentoraz to tool_chain bol schopny spracovat. 
 +   * Pri testovani developerskeho suboru som zistil, ze subor meaningless_sentences.csts obsahuje jednak zmysluplne vety (alebo som nezachytil nejaku pravopisnu chybu) a jednak vety, ktore neobsahuju morfologicku, ani syntakticku chybu. 
 +      * Aha, tak to se na ne rada podivam. 
 +      Navrhujem rucne prejst subor a vyhadzat z neho zmysluplne vety. 
 +      - Navrhujem vytvorit vlastny subor nezmysluplnych viet a pouzit ho ako dev-subor. 
 +   * Akym sposobom sa chystate testovat SyMorAn na evaluacnych datach? Otestujete nimi aj rocnikovy projekt? Dorucite mi rovno vysledky alebo vystup mojich programov a statistiku si spracujem sam? 
 +      * Poslu Vam primo vystup Vaseho programu. 
 + 
 + 
 + 
 +====== Vysledky na vlastnych testovacich udajoch ====== 
 +   * Pripravil som subor vlastnych testovacich udajov, ktore by sme mohli pouzit namiesto dev-suborov 
 +   * Subory najdete na [[http://vincworld.xf.cz/RP/pohadka.ko]] a [[http://vincworld.xf.cz/RP/pohadka.ok]] 
 +      * Jak jste ty soubory vygeneroval? 
 +   * Tu su vysledky: 
 +      * Aplikacia **MorAn (RP)** 
 +         * Subor KO: 60% 
 +         * Subor OK: 72% 
 +      * Aplikacia **SyMorAn** 
 +         * Subor KO: 66% 
 +         * Subor OK: 66%
  
 ====== Technické detaily ====== ====== Technické detaily ======

[ Back to the navigation ] [ Back to the content ]