[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Table of Contents

CAK 2.0

Aktuality

Publikovani

CD ROM

Adresar /net/projects/REST/data/CAC/cac20 je nasim 'ladicim' adresarem. Az budete mit nastroje nachystane v nejake verzi (nemusi byt definitivni), tak je ulozte do spravneho adresare - abychom mohli zvolna zacit ladit.

Pruvodce

Design

KDO-CO-JAK

Pokud jste se zatoulali na tuto stranku a nasli zde prekvapive (bez predchoziho varovani) svoje jmeno, tak mate pravdu;-) Vezte, ze budete varovani velmi brzo!!

Ondrej Bojar

Jarka Hlavacova

  1. Na cd-rom CAC 2.0 by mela byt 'nova' morfologie, ktera uz nepotrebuje 2GB mista.
  2. Tak jak je mozne prohlizet i anal. fce PDT, tak to bude mozne i pro CAC. Volani morfologie z Bonito zustane zachovano.

Emil Jerabek
Michal Kebrt

Oldrich Kruza

  1. Postup stejny jako pro CAC 1.0, tj. az budou data nachystana k publikaci, tak je nalit do Bonito.

Ondrej Kucera

Pavel Kveton

Jirka Mirovsky

Pavel Pecina

11.4.2007 Pavel pise:
Ano, tokenizer muzete pouzit.

Jeho kod je zde: /net/projects/textseg

A dokumentace tady: https://wiki.ufal.ms.mff.cuni.cz/internal:textseg

Pavel Ceska uz na nem nepracuje, ale nic v nem neni zadratovano tak, aby
to neslo rychle a dobre upravit. Porad planujeme pizzovy seminar, na
kterem by se to mohlo vsechno jeste probrat a pripadne upravit. Takze,
nez budete chtit nejakou finalni verzi, tak nam jeste dejte vedet.

Kiril Ribarov

  1. S jakym formatem dat MST pracuje? Umi PML.
  2. MST parser natrenovat na jakych datech - kompletni syntakticky anotovana data z PDT 2.0?

Michal Sotkovsky

Honza Raab

  1. bude umet cist z a zapisovat do PML?
    1. > ano, bude
  2. Tagger natrenovat na jakych datech - kompletni morfologicky anotovana data z PDT 2.0?
    1. > nic jiného k trénování vhodného asi ani nemáme - ale PDT je v některých věcech nekompatibilní s CAK (např. číslovky)

KALENDAR

18.6. v 8:30 probehla schuzka o praci na datech; PRITOMNI: Alla Bemova, Veronika Curdova (anotatorka), Jan Hajic, Barbora Hladka, Jiri Mirovsky, Kiril Ribarov, Zdenka Uresova, Lenka Zehrova (anotatorka)

Udaje psane kurzivou signalizuji splneni.

2007 duben kveten cerven cervenec srpen zari rijen listopad prosinec
Bara zahajit komunikaci s LDC (spolu s Honzou H.)-do 20. cervna odevzdat 'naplnene' xml soubory; 18.6. 8:30 schuzka o datech1. verze Pruvodce-----
do 17.4. pripravit osnovu Pruvodce - viz cast CO bod 3--------
24.4. oslovit ty, kteri budou psat casti Pruvodce--------
Jirka H. --do 20. cervna odevzdat 'naplneny' xml soubor--dodat df verzi LAW pro cddodat tutorial k LAW--
Jarka --do 20. cervna odevzdat 'naplnene' xml soubory--dodat df verzi morf. anal. pro cddodat tutorial k Bonito--
Jirka M. kontrola morf. anotaci-do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; 18.6. 8:30 schuzka o datech--dodat df. verzi Netgraphdodat tutorial k Netgraph--
Kiril prubezne priprava dat pro anotatoryvymyslet strategii pro porovnani souboru od anotatorumakra do TrEd; 18.6. 8:30 schuzka o datech--dodat df verzi parseru pro cd---
Honza R. do 23.4. pripravit xml soubory pro jednotlive casti Pruvodce--1. verze Pruvodce-dodat df verzi taggeru pro cd---
Pavel Q. -----dodat morfologii pro Bonito---
Ondra B. -------1. verze instalatoru-
Michal K. ------tool_chain--
Michal S. -----dodat designove podklady---
Ondrej K. -----dodat df verzi STYX pro cddodat tutorial k STYX--
Leos Prikryl ------dodat df. verzi TrEdVoice (ve spolupraci s Plzni)dodat tutorial k TrEdVoice

POKYNY

Pruvodce

Vsechny potrebne soubory jsou ~/raab/cac-guide. Protoze nektere odstavce budou totozne s odstavci z Pruvodce CAK 1.0, realizujte 'cut'n paste' ze souboru z adresare cac1/.

      cac1/ - finalni verze CAC 1.0
      upload/ - oblibeny adresar pro zapis zmenenych souboru
      pdf/ - aktualni pdf verze

Dokumentace k nastrojum

Adresar nastroje bude mit nasledujici strukturu

Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW

Tutorialy

K nastrojum s grafickym rozhranim, tedy

Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim.

Smysluplnost tutorialu ODSOUHLASENA.

V Pruvodci CAC 2.0 bude rovnez odkaz na PDT tutorial z lonskeho listopadu

PRACE NA DATECH podrobne

Pro anotatory

context: .*
hint:
text:<? $${m/w/token}eq$${m/form} ?
'#{'.CustomColor('sentence').'}${m/w/token}' :
'#{-over:1}#{'.CustomColor('spell').'}['.
join(“ ”,map { $_→{token} } ListV($this→attr('m/w'))).
']#{-over:0}#{'.CustomColor('sentence').'}${m/form}' ?>
node:<? $${afun} eq “AuxS” ? '${id}' : '${m/form}' ?>
node:<?$${afun}?>

Interni adresarova struktura

Soubory - prehled JIZ zpracovanych v danem kole

jmeno souboru 1. kolo (03_2annotations) 2. kolo (06_manual_check)
a01w ab ab
a02w ab ab
a03w ab ab
a04w
a05w
a06w
a07w
a08w
a09w
a10w
a11w
a12w
a13w
a14w
a15w
a16s
a17s
a18s
a19s
a20w
jmeno souboru 1. kolo (03_2annotations) 2. kolo (06_manual_check)
n01w ab ab
n02w ab ab
n03w ik ab
n04w ik ab
n05w ik ab
n06w ik ab
n07w ik ab
n08w ik ab
n09w ik ab
n10w ik ab
n11w ik ab
n12w ik ab
n13w ik ab
n14w ik ab
n15w ik ab
n16w ik ab
n17w ik ab
n18w ik ab
n19w ik ab
n20w ik ab
n21w ik ab
n22w ik ab
n23w ik ab
n24w ik ab
n25w ik ab
n26w ik ab
n27w ik ab
n28w ik ab
n29w ik ab
n30w ik ab
n31w ik ab
n32w ik
n33w ik
n34w ik
n35w ik
n36w
n37w
n38w
n39w
n40w
n41w
n42w
n43w
n44w
n45w
n46w
n47w
n48w
n49w
n50w
n51w
n52w
n53s
n54s
n55s
n56s
n57s
n58s
n59s
n60s
jmeno souboru 1. kolo (03_2annotations) 2. kolo (06_manual_check)
s00s
s01w ab ab
s02w ab ab
s03w kg,kk ab
s04w kg,kk ab
s05w kg,kk ab
s06w kg,kk ab
s07w kg,kk ab
s08w kg,kk ab
s09w kg,kk ab
s10w kg,kk ab
s11w ab ab
s12w ab ab
s13w ab ab
s14w ab ab
s15w ab ab
s16w ab ab
s17w sk ab
s18w sk ab
s19w sk ab
s20w sk ab
s21w sk ab
s22w sk ab
s23w sk ab
s24w sk ab
s25w sk ab
s26w sk ab
s27w sk ab
s28w sk ab
s29w sk ab
s30w sk ab
s31w kk,kg ab
s32w kk,mz ab
s33w kk,mz ab
s34w kk,kg ab
s35w kg,mz ab
s36w kk,mz ab
s37w kk,kg ab
s38w kg,mz ab
s39w kk,mz ab
s40w kk,kg ab
s41w kk ab*
s42w kk ab*
s43w kk ab*
s44w kk ab*
s45w kk ab*
s46w mz zu
s47w mz zu
s48w mz zu
s49w mz zu
s50w mz zu
s51w
s52w
s53w
s54w
s55w
s56w kk ab*
s57w kk ab*
s58w kk ab*
s59w kk ab*
s60w kk ab*
s61w mz zu
s62w mz zu
s63w mz zu
s64w mz zu
s65w mz zu
s66w mz zu
s67w mz zu
s68w mz zu
s69s mz zu
s70s mz zu
s71s
s72s
s73s
s74s
s75s
s76s
s77s
s78s
s79s
s80s
s81s
s82s
s83s
s84s
s85s
s86s
s87s
s88s
s89s
s90s
s91s
s92s
s93s
s94s
s95s
s96s
s97s
s98s
s99s

KONTAKTY


[ Back to the navigation ] [ Back to the content ]