[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:hladka:vincent-kriz [2009/02/12 11:41]
vincent.kriz Pridana informacia o programe najblizsieho stretnutia
user:hladka:vincent-kriz [2009/05/08 14:10]
vincent.kriz Pridane vysledky na vlastnych testovacich udajoch
Line 17: Line 17:
  
 ====== Stretnutia ====== ====== Stretnutia ======
-   * Mohli by sme sa stretnúť v __pondelok, 16.02.2009__? +   * Mohli by sme sa stretnúť v __pondelok, 09.05.2009__? 
    * Čo by som chcel prebrať:    * Čo by som chcel prebrať:
-      * Parsovanie CSTS súborov +      * Predstavenie a ukazka aplikacie SyMorAn (prinesiem notebook) 
-      Čo bude reprezentovat slovo/vetnú jednotku - základný údajový element +         prepinace 
-      * Definovanie zmysluplnosti, čo napísať do //úvahy o zmysluplnosti// do BC :) +         * 3 mody vystupu 
-      * Predstavenie algoritmu (prvý nástrel)+         * morfologicke moduly 
 +         * syntakticky modul 
 +         * 4 urovne chyb 
 +         * zaverecna statistika 
 +      * Diskusia nad textom prace 
 +      * Predstavenie webovej stranky (ak ju to pondelka stihnem napisat)
  
-====== Výstup tool_chainu, definovanie zmysluplnosti ====== +====== Text bakalarky ====== 
-   Nainštaloval som si novú verziu tool_chainu vyskúšal aj ďalšie nástroje z ČAK 2.0. Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzy. V bakalárskej práci budem využívať (parsovaťtieto tagy+   Mozete sem, prosim, napisat ako maju vyzerat zaznamy v Literature - jednak na webove stranky jednak na Sprievodcu CAK 2.0 
-      <t> morfologická značka (czech positional morphological system tag+   * Zoznam obrazkov tabuliek mam vlozit na zaciatok prace (za obsah), na koniec (za literaturu) alebo na uplny koniec (za prilohy)? 
-      <A> syntaktická značka (popísaná v Sprievodcovi ČAK 2.0+   * Praca obsahuje 2 dodatky - morfologicke tabulky a popis CD-ROM 
-      <r> pozícia slova vo vete (vyjadrujúca slovosled+   * Privitam akekolvek navrhy/napady na zlepsenie textu :))) 
-      * <g> odkaz na nadradené slovo +   Mam do Uvodu napisat presne zadanie prace (z SISu)? 
-   Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosť. Zatiaľ mám pocit, že by sa nemusela príliš líšiť od našej "morfologickej" zmysluplnosti - ešte stále nemáme k dispozícii slovo ako také (jeho význam) ale namiesto neho zavedieme objekt, ktorý bude charakterizovaný vyššie spomenutými značkami. Veta bude mať zmysel, ak v nej neobjavíme žiaden protiklad s navrhnutými morfologicko-syntaktickými pravidlami.+ 
 +====== Testovacie udaje ====== 
 +   Dev-subory, ktore ste mi poslala som nevedel spracovat tool_chainom (nevedel som spustit parser), preto som zo suboru vybral cisty text viet a znovu ich prehnal tool_chainom. Tentoraz to tool_chain bol schopny spracovat. 
 +   Pri testovani developerskeho suboru som zistil, ze subor meaningless_sentences.csts obsahuje jednak zmysluplne vety (alebo som nezachytil nejaku pravopisnu chybua jednak vety, ktore neobsahuju morfologicku, ani syntakticku chybu. 
 +      - Navrhujem rucne prejst subor a vyhadzat z neho zmysluplne vety. 
 +      - Navrhujem vytvorit vlastny subor nezmysluplnych viet a pouzit ho ako dev-subor. 
 +   Akym sposobom sa chystate testovat SyMorAn na evaluacnych datach? Otestujete nimi aj rocnikovy projekt? Dorucite mi rovno vysledky alebo vystup mojich programov a statistiku si spracujem sam? 
 + 
 + 
 +====== Vysledky na vlastnych testovacich udajoch ====== 
 +   Pripravil som subor vlastnych testovacich udajov, ktore by sme mohli pouzit namiesto dev-suborov 
 +   * Subory najdete na [[http://vincworld.xf.cz/RP/pohadka.ko]] a [[http://vincworld.xf.cz/RP/pohadka.ok]] 
 +   * Tu su vysledky: 
 +      * Aplikacia **MorAn (RP)** 
 +         * Subor KO: 60% 
 +         * Subor OK: 72% 
 +      * Aplikacia **SyMorAn** 
 +         * Subor KO: 66% 
 +         * Subor OK: 66%
  
 ====== Technické detaily ====== ====== Technické detaily ======

[ Back to the navigation ] [ Back to the content ]