[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:hladka:vincent-kriz [2009/02/12 11:37]
vincent.kriz Doplnil som informacie z povodnej Wiki stranky
user:hladka:vincent-kriz [2009/06/30 09:02] (current)
vincent.kriz
Line 16: Line 16:
    * 20/05/2009 - odovzdanie bakalárskej práce    * 20/05/2009 - odovzdanie bakalárskej práce
  
-====== Výstup tool_chainu, definovanie zmysluplnosti ====== 
-   * Nainštaloval som si novú verziu tool_chainu a vyskúšal aj ďalšie nástroje z ČAK 2.0. Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzy. V bakalárskej práci budem využívať (a parsovať) tieto tagy: 
-      * <t> morfologická značka (czech positional morphological system tag) 
-      * <A> syntaktická značka (popísaná v Sprievodcovi ČAK 2.0) 
-      * <r> pozícia slova vo vete (vyjadrujúca slovosled) 
-      * <g> odkaz na nadradené slovo 
-   * Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosť. Zatiaľ mám pocit, že by sa nemusela príliš líšiť od našej "morfologickej" zmysluplnosti - ešte stále nemáme k dispozícii slovo ako také (jeho význam) ale namiesto neho zavedieme objekt, ktorý bude charakterizovaný vyššie spomenutými značkami. Veta bude mať zmysel, ak v nej neobjavíme žiaden protiklad s navrhnutými morfologicko-syntaktickými pravidlami. 
  
-====== Technické detaily ====== +====== Stretnutia ====== 
-   Použití SVN serveru na ÚFAL +   Mohli by sme sa stretnúť v __pondelok, 18.05.2009__?  
-      * [[http://ufal.mff.cuni.cz/~hladka/rp200809/svn-prednaska2.pdf|kraťoučký tutoriál o svn ]] +   * Čo by som chcel prebrať: 
-      * ''/home/svn/repos/bc_kriz/userkrizpasswdbc_kriz'' +      * Ako som zapracoval Vase pripomienky + hodnotenie zvysnych kapitol a priloh 
-      * vlastní účet v síti ÚFAL nepotřebujete budete commitovat do své SVN a prohlížet si ji na webuNa ''https://svn.ms.mff.cuni.cz/projects/'' je Váš projekt videt - viz ''https://svn.ms.mff.cuni.cz/projects/bc_kriz, userufalpasswd: maly_lingvista''Tady budou časem jednotlivé soubory v poslední verzis možností prohlížet ty starší: ''https://svn.ms.mff.cuni.cz/projects/bc_kriz/browser''+      * Ukazka webovej stranky - ak pan Kebrt dovtedy odpise :) 
-      * Co se týče subverse, tak ani na ni nepotřebujete mít přístup na síť ÚFALPotřebujete mít nějakého klienta (standardní svn na linuxu, nebo třeba SVN Tortoise na windows)A rovnou můžete začít se subversíasi nějaký ''svn import'' a ''svn checkout'' ... Zde je info: ''http://svnbook.red-bean.com/en/1.5/svn.tour.importing.html''. Repository má adresu ''svn://svn.ms.mff.cuni.cz/bc_kriz'', takže ''checkout'' třeba ''svn checkout svn://svn.ms.mff.cuni.cz/bc_kriz/trunk his_local_directory''+      * Vase vysledky na Vasich testovacich udajoch 
 + 
 +====== Text bakalarky ====== 
 +   * Mozete sem, prosim, napisat ako maju vyzerat zaznamy v Literature - jednak na webove stranky a jednak na Sprievodcu CAK 2.0 
 +      *   \bibitem[Vidová Hladká, 2008]{hladka:2008} Vidová Hladká Barbora, Jan Hajiè, Jiøí Hana, Jaroslava Hlaváèová, Jiøí Mírovský, Jan RaabCzech Academic Corpus 2.0CD-ROMISBN1-58563-491-3. Linguistic Data Consortiumcat. num.LDC2008T22, Philadelphia, Pennsylvania, USA, 2008. 
 +      * \bibitem[CAC 2.02008]{cac:2008} Czech Academic Corpus 2.0 on-line. \tt{http://ufal.mff.cuni.cz/rest/cac/cac\_20.html} 
 + 
 +   * Zoznam obrazkov a tabuliek mam vlozit na zaciatok prace (za obsah), na koniec (za literaturu) alebo na uplny koniec (za prilohy)? 
 +      * Za obsah. 
 +      * Literatura je na konci textu pred prilohami. 
 + 
 +   * Praca obsahuje 2 dodatky - morfologicke tabulky a popis CD-ROM 
 +      * DobreTo mate popis morfologickych znacek jako latexovskou tabulku? 
 +   * Privitam akekolvek navrhy/napady na zlepsenie textu :))) 
 +      * Peclive jsem precetla prvni verzikterou jste mi poslalK te druhe jsem se nedostalacastecne i zamerneProjedeme tu prvni a uvidite;-)) 
 +   * Mam do Uvodu napisat presne zadanie prace (z SISu)? 
 +      * Myslim, ze to neni nutneAbstrakt slovensky a cesky staci. 
 + 
 + 
 +====== Testovacie udaje ====== 
 +   * Dev-subory, ktore ste mi poslala som nevedel spracovat tool_chainom (nevedel som spustit parser), preto som zo suboru vybral cisty text viet a znovu ich prehnal tool_chainomTentoraz to tool_chain bol schopny spracovat. 
 +   * Pri testovani developerskeho suboru som zistil, ze subor meaningless_sentences.csts obsahuje jednak zmysluplne vety (alebo som nezachytil nejaku pravopisnu chybu) a jednak vety, ktore neobsahuju morfologicku, ani syntakticku chybu
 +      * Aha, tak to se na ne rada podivam. 
 +      - Navrhujem rucne prejst subor a vyhadzat z neho zmysluplne vety. 
 +      - Navrhujem vytvorit vlastny subor nezmysluplnych viet a pouzit ho ako dev-subor. 
 +   * Akym sposobom sa chystate testovat SyMorAn na evaluacnych datach? Otestujete nimi aj rocnikovy projekt? Dorucite mi rovno vysledky alebo vystup mojich programov a statistiku si spracujem sam? 
 +      * Poslu Vam primo vystup Vaseho programu. 
 + 
 + 
 + 
 + 
 +====== Vysledky na developerskych testovacich udajoch ====== 
 +   * Do bakalarky som zaclenil vysledky Moran/Symoran na developerskych udajochSu v podstate navlas rovnakes tym rozdielom, ze Symoran odhalil vacsi pocet chybCo sa tyka ale poctu OK/KO viet, ten je rovnaky. 
 +   * Tu je statistika: 
 +      * **Meaningless_sentences** 
 +''           Pocet spracovanych viet101 
 +           Pocet OK viet: 70 (69.31%) 
 +           Pocet KO viet: 31 (30.69%) 
 +           Pocet chyb spolu: 39 
 +           Podiel modulov na objavenych chybach: 
 +                 0 (0.00%) 
 +                 9 (23.08%) 
 +                 (2.56%) 
 +                 0 (0.00%) 
 +                 4 (10.26%) 
 +                 8 (20.51%) 
 +                 0 (0.00%) 
 +                 17 (43.59%)'' 
 +      * **Meaningfull_sentences** 
 +''Pocet spracovanych viet20 
 +Pocet OK viet: 14 (70.00%) 
 +Pocet KO viet: 6 (30.00%) 
 +Pocet chyb spolu: 7 
 +Podiel modulov na objavenych chybach: 
 +X       0 (0.00%) 
 +A       1 (14.29%) 
 +C       0 (0.00%) 
 +J       0 (0.00%) 
 +N       2 (28.57%) 
 +P       4 (57.14%) 
 +V       0 (0.00%) 
 +R       0 (0.00%)'' 
 +   * Do kapitoly Vysledky tak zostava doplnit Vase testovanie :) 
 + 
  
  

[ Back to the navigation ] [ Back to the content ]