This is an old revision of the document!
Table of Contents
Vitajte na Wikistránke k bakalárskej práci
Určování syntaktické smysluplnosti českých vět
Podrobné informácie o práci
- …sú uvedené na stránkach SIS UK: [https://is.cuni.cz/studium/dipl_st/index.php?doo=detail&did=66314]
- …na ročníkovom projekte, ktorý predchádzal bakalárskej práci nájdete tu: [http://vincwiki.php5.cz/index.php/Ro%C4%8Dn%C3%ADkov%C3%BD_projekt]
Plánovaný harmonogram
- 31/01/2009 - naštudovanie výstupu tool_chainu, diskusia nad riešením, definovanie zmysluplnosti, technické detaily (účet na UFAL, SVN)
- 28/02/2009 - opraviť dokumentáciu k ročníkovému projektu, návrh algoritmu na určenie zmysluplnosti
- 16/03/2009 - implementácia algoritmu
- 13/04/2009 - testovanie na dátach, optimalizácia algoritmu/pravidiel
- 5/05/2009 - záver práce na bakalárke - dolaďovanie textu, zdrojových kódov
- 20/05/2009 - odovzdanie bakalárskej práce
Stretnutia
- Mohli by sme sa stretnúť v pondelok, 04.05.2009?
- Čo by som chcel prebrať:
- Predstavenie a ukazka aplikacie SyMorAn :)
- prepinace
- 3 mody vystupu
- morfologicke moduly
- syntakticky modul
- 4 urovne chyb
- zaverecna statistika
- Diskusia nad textom prace (aktualnu verziu Vam poslem mailom)
- Ako citovat z literatury, ako uviest diela, z ktorych cerpam
- Odstavec o CSTS sa ma citovat?
- Pouzil som obrazok ziskany z TrEd-u - ako je to s copyrightom? :)
- Pozdava sa Vam sktukturovanie textu?
- Ako budeme testovat aplikaciu (ake testovacie data pouzit, ako budeme prezentovat vysledky)
- Co ocakavate od webovej aplikacie (ma byt popisana v praci?)
Výstup tool_chainu, definovanie zmysluplnosti
- Nainštaloval som si novú verziu tool_chainu a vyskúšal aj ďalšie nástroje z ČAK 2.0. Zoznámil som sa s formátom CSTS doplneným o tagy syntaktickej analýzy. V bakalárskej práci budem využívať (a parsovať) tieto tagy:
- <t> morfologická značka (czech positional morphological system tag)
- <A> syntaktická značka (popísaná v Sprievodcovi ČAK 2.0)
- <r> pozícia slova vo vete (vyjadrujúca slovosled)
- <g> odkaz na nadradené slovo
- Na najbližšom stretnutí by sme mohli prebrať tému ako definovať zmysluplnosť. Zatiaľ mám pocit, že by sa nemusela príliš líšiť od našej “morfologickej” zmysluplnosti - ešte stále nemáme k dispozícii slovo ako také (jeho význam) ale namiesto neho zavedieme objekt, ktorý bude charakterizovaný vyššie spomenutými značkami. Veta bude mať zmysel, ak v nej neobjavíme žiaden protiklad s navrhnutými morfologicko-syntaktickými pravidlami.
Technické detaily
- Použití SVN serveru na ÚFAL
/home/svn/repos/bc_kriz/, user: kriz, passwd: bc_kriz
- vlastní účet v síti ÚFAL nepotřebujete, budete commitovat do své SVN a prohlížet si ji na webu. Na
https://svn.ms.mff.cuni.cz/projects/
je Váš projekt videt - vizhttps://svn.ms.mff.cuni.cz/projects/bc_kriz, user: ufal, passwd: maly_lingvista
. Tady budou časem jednotlivé soubory v poslední verzi, s možností prohlížet ty starší:https://svn.ms.mff.cuni.cz/projects/bc_kriz/browser
. - Co se týče subverse, tak ani na ni nepotřebujete mít přístup na síť ÚFAL. Potřebujete mít nějakého klienta (standardní svn na linuxu, nebo třeba SVN Tortoise na windows). A rovnou můžete začít se subversí, asi nějaký
svn import
asvn checkout
… Zde je info:http://svnbook.red-bean.com/en/1.5/svn.tour.importing.html
. Repository má adresusvn://svn.ms.mff.cuni.cz/bc_kriz
, takžecheckout
třebasvn checkout svn://svn.ms.mff.cuni.cz/bc_kriz/trunk his_local_directory