[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Zkusenosti s praci nad CAC 1.0 a jeho pruvodcem me nuti uz ted premyslet o vydani druhe verze CAC. Vse se odviji od terminu vydani - protoze projekt IS, pod ktery prace nad CAC spada, konci v roce 2008, musi byt CAC 2.0 vydan (nebo alespon podan do tisku) do konce roku 2008.

CO?

  1. publikovani
    • u LDC
  2. CD ROM
    • bonus-tracks/
    • data/
      • format: PML (CSTS?)
      • zahrnout puvodni anotace?
    • tutorials/ (tutorialy nastroju jako napr. STYX - demo)
    • tools/
      • Bonito/
      • LAW/
      • TrEd/
      • tokenizer/
      • MA/
      • tagger/
      • parser/
      • morph-parse-chain - tATP
        • -t … tokenizer
        • -A … morfologicka analyza
        • -T … tagging
        • -AT … morf. analyza a nasledne tagging
        • -P … parsing
        • -tATP - run it all
  3. Pruvodce
    • cesky, nasledne anglicky preklad
  4. Design
    • CD, plakat, web

KDO-CO-JAK

Pokud jste se zatoulali na tuto stranku a nasli zde prekvapive (bez predchoziho varovani) svoje jmeno, tak mate pravdu;-) Vezte, ze budete varovani velmi brzo!!

Ondrej Bojar

konzultovat s Honzou H.) a praci nad CAC 2.0 podridit jejich podminkam.

Jarka Hlavacova
* Bonito
* prohlizeni *.m souboru (viz CAK 1.0)
* prohlizeni anal. fci z *.a souboru (viz PDT)
* morfologie (viz CAK 1.0)
* MA
* 'studentska' MA
-
Na cd-rom CAC 2.0 by mela byt 'nova' morfologie, ktera uz nepotrebuje 2GB mista.
-
Tak jak je mozne prohlizet i anal. fce PDT, tak to bude mozne i pro CAC. Volani morfologie z Bonito zustane zachovano.

Emil Jerabek
Michal Kebrt
* morph-parse-chain
* cast 'morph' - viz CAK 1.0?
* doplnit parser
* s jakym formatem dat pracovat (PML vs. CSTS)
Oldrich Kruza
* CAK do Bonito
* viz CAK 1.0
-
Postup stejny jako pro CAC 1.0, tj. az budou data nachystana k publikaci, tak je nalit do Bonito.

Ondrej Kucera
* STYX
Pavel Kveton
* morfologie v Bonito
* viz CAK 1.0
-
Morfologie jakou soucast Bonito pro Win i pro Linux

Jirka Mirovsky
* kontrola morfologickych anotaci
Pavel Pecina
* tokenizer
11. 4. 2007 Pavel pise:

Ano, tokenizer muzete pouzit.

Jeho kod je zde: /net/projects/textseg

A dokumentace tady: https://wiki.ufal.ms.mff.cuni.cz/internal:textseg

Pavel Ceska uz na nem nepracuje, ale nic v nem neni zadratovano tak, aby
to neslo rychle a dobre upravit. Porad planujeme pizzovy seminar, na
kterem by se to mohlo vsechno jeste probrat a pripadne upravit. Takze,
nez budete chtit nejakou finalni verzi, tak nam jeste dejte vedet.

Kiril Ribarov
* parser
* MST - s jakym formatem pracuje?
* vyhodnoceni rucnich syntaktickych anotaci
Michal Sotkovsky
* design
* navrh tak pekny jako CAK 1.0 - pouze zmenit barvicky
Honza Votrubec
* tagger
* bude umet cist z a zapisovat do PML?
* technicky editor pruvodce


[ Back to the navigation ] [ Back to the content ]