Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:vincent-kriz [2009/02/12 11:41] vincent.kriz Pridana informacia o programe najblizsieho stretnutia |
user:hladka:vincent-kriz [2009/05/07 09:45] vincent.kriz Otazky a ulohy tykajuce sa najblizsieho stretnutia |
||
---|---|---|---|
Line 17: | Line 17: | ||
====== Stretnutia ====== | ====== Stretnutia ====== | ||
- | * Mohli by sme sa stretnúť v __pondelok, | + | * Mohli by sme sa stretnúť v __pondelok, |
* Čo by som chcel prebrať: | * Čo by som chcel prebrať: | ||
- | * Parsovanie CSTS súborov | + | * Predstavenie a ukazka aplikacie SyMorAn (prinesiem notebook) |
- | * Čo bude reprezentovat slovo/ | + | * prepinace |
- | * Definovanie zmysluplnosti, čo napísať do //úvahy o zmysluplnosti// | + | * 3 mody vystupu |
- | * Predstavenie algoritmu | + | * morfologicke moduly |
+ | * syntakticky modul | ||
+ | * 4 urovne chyb | ||
+ | * zaverecna statistika | ||
+ | * Diskusia nad textom prace | ||
+ | * Predstavenie webovej stranky (ak ju to pondelka stihnem napisat) | ||
+ | |||
+ | ====== Text bakalarky ====== | ||
+ | * Mozete sem, prosim, napisat ako maju vyzerat zaznamy v Literature - jednak na webove stranky a jednak na Sprievodcu CAK 2.0 | ||
+ | * Zoznam obrazkov a tabuliek mam vlozit na zaciatok prace (za obsah), na koniec (za literaturu) alebo na uplny koniec (za prilohy)? | ||
+ | * Praca obsahuje 2 dodatky - morfologicke tabulky a popis CD-ROM | ||
+ | * Privitam akekolvek navrhy/napady na zlepsenie textu :))) | ||
+ | | ||
+ | |||
+ | ====== Testovacie udaje ====== | ||
+ | * Dev-subory, ktore ste mi poslala som nevedel spracovat tool_chainom (nevedel som spustit parser), preto som zo suboru vybral cisty text viet a znovu ich prehnal tool_chainom. Tentoraz to tool_chain bol schopny spracovat. | ||
+ | * Pri testovani developerskeho suboru som zistil, ze subor meaningless_sentences.csts obsahuje jednak zmysluplne vety (alebo som nezachytil nejaku pravopisnu chybu) a jednak vety, ktore neobsahuju morfologicku, | ||
+ | - Navrhujem rucne prejst subor a vyhadzat z neho zmysluplne vety. | ||
+ | - Navrhujem vytvorit vlastny subor nezmysluplnych viet a pouzit ho ako dev-subor. | ||
+ | * Akym sposobom sa chystate testovat SyMorAn na evaluacnych datach? Otestujete nimi aj rocnikovy projekt? Dorucite mi rovno vysledky alebo vystup mojich programov a statistiku si spracujem sam? | ||
- | ====== Výstup tool_chainu, | ||
- | * Nainštaloval som si novú verziu tool_chainu a vyskúšal aj ďalšie nástroje z ČAK 2.0. Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzy. V bakalárskej práci budem využívať (a parsovať) tieto tagy: | ||
- | * <t> morfologická značka (czech positional morphological system tag) | ||
- | * <A> syntaktická značka (popísaná v Sprievodcovi ČAK 2.0) | ||
- | * <r> pozícia slova vo vete (vyjadrujúca slovosled) | ||
- | * <g> odkaz na nadradené slovo | ||
- | * Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosť. Zatiaľ mám pocit, že by sa nemusela príliš líšiť od našej " | ||
====== Technické detaily ====== | ====== Technické detaily ====== |