[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vincent-kriz [2009/04/27 17:22]
vincent.kriz
user:hladka:vincent-kriz [2009/05/10 21:26]
hladka
Line 15: Line 15:
     5/05/2009 - záver práce na bakalárke - dolaďovanie textu, zdrojových kódov     5/05/2009 - záver práce na bakalárke - dolaďovanie textu, zdrojových kódov
    * 20/05/2009 - odovzdanie bakalárskej práce    * 20/05/2009 - odovzdanie bakalárskej práce
 +
  
 ====== Stretnutia ====== ====== Stretnutia ======
-   * Mohli by sme sa stretnúť v __pondelok, 04.05.2009__? +   * Mohli by sme sa stretnúť v __pondelok, 09.05.2009__?  
 +      * 9. 5. uz bylo v sobotu, ale pocitam se setkanim v pondeli 11.;-))
    * Čo by som chcel prebrať:    * Čo by som chcel prebrať:
-      * Predstavenie a ukazka aplikacie SyMorAn :)+      * Predstavenie a ukazka aplikacie SyMorAn (prinesiem notebook)
          * prepinace          * prepinace
          * 3 mody vystupu          * 3 mody vystupu
Line 26: Line 28:
          * 4 urovne chyb          * 4 urovne chyb
          * zaverecna statistika          * zaverecna statistika
-      * Diskusia nad textom prace (aktualnu verziu Vam poslem mailom+      * Diskusia nad textom prace 
-         Ako citovat z literatury, ako uviest dielaz ktorych cerpam +      * Predstavenie webovej stranky (ak ju to pondelka stihnem napisat
-         Odstavec o CSTS sa ma citovat+ 
-         Pouzil som obrazok ziskany z TrEd-ako je to s copyrightom? :) + 
-         Pozdava sa Vam sktukturovanie textu+====== Text bakalarky ====== 
-      * Ako budeme testovat aplikaciu (ake testovacie data pouzitako budeme prezentovat vysledky+   Mozete semprosim, napisat ako maju vyzerat zaznamy v Literature - jednak na webove stranky a jednak na Sprievodcu CAK 2.0 
-      * Co ocakavate od webovej aplikacie (ma byt popisana v praci?)+      *   \bibitem[Vidová Hladká2008]{hladka:2008} Vidová Hladká Barbora, Jan Hajiè, Jiøí Hana, Jaroslava Hlaváèová, Jiøí Mírovský, Jan Raab. Czech Academic Corpus 2.0. CD-ROM, ISBN: 1-58563-491-3. Linguistic Data Consortium, cat. num.: LDC2008T22, Philadelphia, Pennsylvania, USA, 2008. 
 +      \bibitem[CAC 2.0, 2008]{cac:2008} Czech Academic Corpus 2.0 on-line. \tt{http://ufal.mff.cuni.cz/rest/cac/cac\_20.html} 
 + 
 +   * Zoznam obrazkov a tabuliek mam vlozit na zaciatok prace (za obsah), na koniec (za literaturu) alebo na uplny koniec (za prilohy)
 +      Za obsah. 
 +      * Literatura je na konci textu pred prilohami. 
 + 
 +   * Praca obsahuje 2 dodatky morfologicke tabulky a popis CD-ROM 
 +      * Dobre. To mate popis morfologickych znacek jako latexovskou tabulku? 
 +   * Privitam akekolvek navrhy/napady na zlepsenie textu :))
 +      Peclive jsem precetla prvni verzi, kterou jste mi poslal. K te druhe jsem se nedostala, castecne i zamerne. Projedeme tu prvni a uvidite;-)) 
 +   * Mam do Uvodu napisat presne zadanie prace (z SISu)
 +      * Myslim, ze to neni nutne. Abstrakt slovensky a cesky staci. 
 + 
 +====== Testovacie udaje ====== 
 +   * Dev-subory, ktore ste mi poslala som nevedel spracovat tool_chainom (nevedel som spustit parser)preto som zo suboru vybral cisty text viet a znovu ich prehnal tool_chainom. Tentoraz to tool_chain bol schopny spracovat. 
 +   * Pri testovani developerskeho suboru som zistil, ze subor meaningless_sentences.csts obsahuje jednak zmysluplne vety (alebo som nezachytil nejaku pravopisnu chybua jednak vety, ktore neobsahuju morfologicku, ani syntakticku chybu. 
 +      - Navrhujem rucne prejst subor a vyhadzat z neho zmysluplne vety. 
 +      - Navrhujem vytvorit vlastny subor nezmysluplnych viet a pouzit ho ako dev-subor. 
 +   Akym sposobom sa chystate testovat SyMorAn na evaluacnych datachOtestujete nimi aj rocnikovy projekt? Dorucite mi rovno vysledky alebo vystup mojich programov a statistiku si spracujem sam? 
  
-====== Výstup tool_chainu, definovanie zmysluplnosti ====== +====== Vysledky na vlastnych testovacich udajoch ====== 
-   Nainštaloval som si novú verziu tool_chainu a vyskúšal aj ďalšie nástroje z ČAK 2.0Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzyV bakalárskej práci budem využívať (parsovať) tieto tagy+   Pripravil som subor vlastnych testovacich udajov, ktore by sme mohli pouzit namiesto dev-suborov 
-      <t> morfologická značka (czech positional morphological system tag) +   * Subory najdete na [[http://vincworld.xf.cz/RP/pohadka.ko]] [[http://vincworld.xf.cz/RP/pohadka.ok]] 
-      * <A> syntaktická značka (popísaná v Sprievodcovi ČAK 2.0+   Tu su vysledky: 
-      <r> pozícia slova vo vete (vyjadrujúca slovosled) +      * Aplikacia **MorAn (RP)** 
-      * <g> odkaz na nadradené slovo +         Subor KO: 60% 
-   Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosť. Zatiaľ mám pocit, že by sa nemusela príliš líšiť od našej "morfologickej" zmysluplnosti - ešte stále nemáme k dispozícii slovo ako také (jeho význam) ale namiesto neho zavedieme objekt, ktorý bude charakterizovaný vyššie spomenutými značkami. Veta bude mať zmysel, ak v nej neobjavíme žiaden protiklad s navrhnutými morfologicko-syntaktickými pravidlami.+         * Subor OK: 72% 
 +      * Aplikacia **SyMorAn** 
 +         Subor KO: 66% 
 +         * Subor OK: 66%
  
 ====== Technické detaily ====== ====== Technické detaily ======

[ Back to the navigation ] [ Back to the content ]