This is an old revision of the document!
Zkusenosti s praci nad CAC 1.0 a jeho pruvodcem me nuti uz ted premyslet o vydani druhe verze CAC. Vse se odviji od terminu vydani - protoze projekt IS, pod ktery prace nad CAC spada, konci v roce 2008, musi byt CAC 2.0 vydan (nebo alespon podan do tisku) do konce roku 2008.
CO?
- publikovani
- u LDC
- CD ROM
- bonus-tracks/
- data/
- format: PML (CSTS?)
- zahrnout puvodni anotace?
- tutorials/ (tutorialy nastroju jako napr. STYX - demo)
- tools/
- Bonito/
- LAW/
- TrEd/
- tokenizer/
- MA/
- tagger/
- parser/
- morph-parse-chain - tATP
- -t … tokenizer
- -A … morfologicka analyza
- -T … tagging
- -AT … morf. analyza a nasledne tagging
- -P … parsing
- -tATP - run it all
- Pruvodce
- cesky, nasledne anglicky preklad
- Design
- CD, plakat, web
KDO-CO-JAK
Pokud jste se zatoulali na tuto stranku a nasli zde prekvapive (bez predchoziho varovani) svoje jmeno, tak mate pravdu;-) Vezte, ze budete varovani velmi brzo!!
Ondrej Bojar
- instalacni skript
konzultovat s Honzou H.) a praci nad CAC 2.0 podridit jejich podminkam.
Jarka Hlavacova
* Bonito
* prohlizeni *.m souboru (viz CAK 1.0)
* prohlizeni anal. fci z *.a souboru (viz PDT)
* morfologie (viz CAK 1.0)
* MA
* 'studentska' MA
- Na cd-rom CAC 2.0 by mela byt 'nova' morfologie, ktera uz nepotrebuje 2GB mista.
- Tak jak je mozne prohlizet i anal. fce PDT, tak to bude mozne i pro CAC. Volani morfologie z Bonito zustane zachovano.
Emil Jerabek
Michal Kebrt
* morph-parse-chain
* cast 'morph' - viz CAK 1.0?
* doplnit parser
* s jakym formatem dat pracovat (PML vs. CSTS)
Oldrich Kruza
* CAK do Bonito
* viz CAK 1.0
- Postup stejny jako pro CAC 1.0, tj. az budou data nachystana k publikaci, tak je nalit do Bonito.
Ondrej Kucera
* STYX
Pavel Kveton
* morfologie v Bonito
* viz CAK 1.0
- Morfologie jakou soucast Bonito pro Win i pro Linux
Jirka Mirovsky
* kontrola morfologickych anotaci
Pavel Pecina
* tokenizer
11. 4. 2007 Pavel pise:
Ano, tokenizer muzete pouzit.
Jeho kod je zde: /net/projects/textseg
A dokumentace tady: https://wiki.ufal.ms.mff.cuni.cz/internal:textseg
Pavel Ceska uz na nem nepracuje, ale nic v nem neni zadratovano tak, aby
to neslo rychle a dobre upravit. Porad planujeme pizzovy seminar, na
kterem by se to mohlo vsechno jeste probrat a pripadne upravit. Takze,
nez budete chtit nejakou finalni verzi, tak nam jeste dejte vedet.
Kiril Ribarov
* parser
* MST - s jakym formatem pracuje?
* vyhodnoceni rucnich syntaktickych anotaci
Michal Sotkovsky
* design
* navrh tak pekny jako CAK 1.0 - pouze zmenit barvicky
Honza Votrubec
* tagger
* bude umet cist z a zapisovat do PML?
* technicky editor pruvodce