This is an old revision of the document!
Table of Contents
CAK 2.0
Aktuality
- 23/11/07
-
- Pruvodce je uz v takove fazi, ze je vhodne, abyste si ho precetli
- Prosim o korektury - korektury zaneste do vytisteneho Pruvodce. Byla bych moc rada, kdybyste je stihli do patku 30. listopadu t.r. (prijdu si pro ne:-))Nektere obrazky z pdf vypadly, podivejte se na ne v html (diky).
- Prosim o komentar k demosnimkum, ktere najdete v
/net/projects/rest/CAC/cac20/tutorials
(jeste chybi demosnimek k TrEd - Petr Pajas udela; STYX - chybi df. verze STYX, LAW) Komentare prosim piste primo sem na wiki.- Nethraph
- JM: libi se;-)
- BH: moc rychly, komentare k dotazum; aktualizace JM: zpomalil jsem to o 10% a pridal komentar ke strukturnimu dotazu
- Bonito
- BH: moc velka obrazovka, doplnit uvod a zaver
- JM: libi se, u frekvencni distribuce obe sipky oznaceny VPRED
- TredVoice
- BH: libi se mi
- JM: libi se
- Styx
- TrEd
- Prosim o testovani skriptu
tool_chain
(/net/projects/rest/CAC/cac20/tools/tool_chain
). Komentar posilejte primo Michalovi Kebrtovi (michalek.k@seznam.cz
)
-
- 24/9/07 v 9:00 schuzka k CAK 2.0. chodba ve 4. patre zapadniho kridla - body pgmu, ktere jsme probrali, jsem presunula na patricna mista wiki dokumentace
- CAK 1.0
- Rozesilani Pruvodce - Zatim jsem koupila 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene v prilozenem souboru vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim.
- Pruvodce CAK 2.0
- aktualni verze: html
- Zatim neni nutne cist Pruvodce jako celek. Jeste udelame jedno kolo zmen/doplnku/…,
- Podivejte se na barvy.
- 19/7/07
- Pruvodce CAK 1.0 vysel (viz zde)
- podepsana smlouva mezi UK MFF a LDC
- prvni verze Pruvodce CAK 2.0 vznikla dle planu - diky! Do pulky srpna doplnim, prip. opravim co je potreba a pak se jednotlivcum zase ozvu
- rucni anotace dat dost “boli”, nejak se mi nedari anotatory dostatecne motivovat
- kontrolni skripty nastaveny
Publikovani
- u LDC
- dohoda UK MFF ↔ LDC PODEPSANA
- dohoda UK MFF ↔ UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi
CD ROM
Adresar /net/projects/REST/data/CAC/cac20
je nasim 'ladicim' adresarem. Az budete mit nastroje nachystane v nejake verzi (nemusi byt definitivni), tak je ulozte do spravneho adresare - abychom mohli zvolna zacit ladit.
- bonus-tracks/
- STYX/
- TrEdVoice/ ## Kam presne prijde TrEdVoice? K TrEd?
- data/
- format: PML, CSTS ##
- tools/
- Bonito/
- LAW/
- TrEd/ ## Filelist se seznamem 180 souboru CAK 2.0
- Netgraph/ ## Klient i server.
- tool_chain/
- tokenizer/ ##
- morphology/ ## I SLED?
- tagger/
- parser/ ## Mozne problemy - velikost natrenovaneho modulu, vypocetni a pametove naroky. (KR)
- tool_chain
- tutorials/
Pruvodce
- cesky, nasledne anglicky preklad
- Predmluva (BH, predmluva.xml)
- Uvod (BH, uvod.xml))
- Projekt Ceskeho akademickeho korpusu
- Co je Cesky akademicky korpus 2.0
- Zdroje textu
- Roviny anotace
- Vyvoj projektu
- CAK 1.0
- Na ceste k CAK 2.0
- Tabulka 2.2 - upravy (ktere BH, realizace JR)
- Doplnit popis pilotni studie (KR)
- Jake dalsi morf. kontroly se delaly, upozornit na guessed-form. (JM)
- Doplnit logistiku syntaktickych kontrol. (KR, JM)
- Kvantitativni udaje
- CD-ROM Cesky akademicky korpus 2.0
- Adresarova struktura (BH, adresar.xml)
- Doplnit kam prijde TrEdVoice.
- Ohlidat info o tokenizaci.
- Data (Jirka M., data.xml)
- Format dat
- Konvence pojmenovani souboru
- Velikost dat
- Nastroje U kazdeho nastroje uvest odkaz do kapitoly Tutorialy.
- Bonito (Jarka, nastroje-bonito.xml)
- Doplnit dotazy na linearni vyhledavani ve stromove strukture.
- Obrazek 3.3 nahradit obrazovkou se vsemi atributy CAK 2.0.
- Tabulka 3.7 cara mezi sloupci, mezi radky.
- Tabulku 3.7 ilustrovat - nakreslit strom a u kazdeho uzlu zobrazit hodnoty vsech atributu uvedenych v tabulce a doplnit nejaky dotaz primo v Bonito.
- LAW (Jirka H., nastroje-law.xml)
- TrEd (XY, nastroje-tred.xml)
- Doplnit (BH)
- Netgraph (Jirka M., nastroje-netgraph.xml)
- Spravny spelling je Netgraph.
- Automaticke zpracovani textu (BH, KR o parseru, nastroje-zprac.xml)
- Doplnit odstavec o tokenizaci, pokud tam bude.
- Aktualizovat procenta uspesnosti u taggeru.
- Specifikovat na jakych datech PZK 2.0 byl tagger trenovan.
- Doplnit odstavec o parsingu (uspesnost, trenovaci data).
- Popsat prepinace u tool_chain
- Bonusovy material (bonus.xml)
- Doplnit ilustracni obrazek, neco vice k rozpoznavaci, doplnit citace. (BH)
- Tutorialy (BH, tutorialy.xml)
- Instalace (BH, instalace.xml)
- Distribuce a licence (BH, distribuce.xml)
- Osobnosti v projektu (BH, osobnosti.xml)
- Podekovani (BH, podekovani.xml)
- Literatura (BH, literatura.xml)
- Priloha A Zdroje textu (BH, zdroje.xml)
- Priloha B Popis lemmat (BH, lemmata.xml)
- Priloha C Popis morfologickych znacek (BH, znacky.xml)
- Priloha D Popis analytickych funkci (BH, funkce.xml)
- Priloha E Pavucina (BH, pavucina.xml)
Design
- CD, plakat, web
KDO-CO-JAK
Pokud jste se zatoulali na tuto stranku a nasli zde prekvapive (bez predchoziho varovani) svoje jmeno, tak mate pravdu;-) Vezte, ze budete varovani velmi brzo!!
Ondrej Bojar
- instalacni skripty (viz CAK 1.0)
Jarka Hlavacova
- Bonito
- prohlizeni *.m souboru (viz CAK 1.0)
- prohlizeni anal. fci z *.a souboru (viz PDT)
- morfologie (viz CAK 1.0)
- MA
- 'studentska' MA
- Na cd-rom CAC 2.0 by mela byt 'nova' morfologie, ktera uz nepotrebuje 2GB mista.
- Tak jak je mozne prohlizet i anal. fce PDT, tak to bude mozne i pro CAC. Volani morfologie z Bonito zustane zachovano.
Emil Jerabek
Michal Kebrt
- morph-parse-chain
- cast 'morph' - viz CAK 1.0?
- doplnit parser
- s jakym formatem dat pracovat (PML vs. CSTS)?
Oldrich Kruza
- CAK do Bonito
- viz CAK 1.0
- Postup stejny jako pro CAC 1.0, tj. az budou data nachystana k publikaci, tak je nalit do Bonito.
Ondrej Kucera
- STYX
Pavel Kveton
- morfologie v Bonito
- viz CAK 1.0
Jirka Mirovsky
- kontrola morfologickych anotaci
- kontrolni skripty morf. vs. syntax a syntax (PDT2.0-like kontroly)
- kontrola syntaxe probehne ve dvou fazich:
- s hotovym necelym vzorkem dat - pripraveni skriptu
- posleze se vsemi daty, az budou hotova
Pavel Pecina
- tokenizer
11.4.2007 Pavel pise:
Ano, tokenizer muzete pouzit.
Jeho kod je zde: /net/projects/textseg
A dokumentace tady: https://wiki.ufal.ms.mff.cuni.cz/internal:textseg
Pavel Ceska uz na nem nepracuje, ale nic v nem neni zadratovano tak, aby
to neslo rychle a dobre upravit. Porad planujeme pizzovy seminar, na
kterem by se to mohlo vsechno jeste probrat a pripadne upravit. Takze,
nez budete chtit nejakou finalni verzi, tak nam jeste dejte vedet.
Kiril Ribarov
- parser
- priprava dat pro anotatory
- S jakym formatem dat MST pracuje? Umi PML.
- MST parser natrenovat na jakych datech - kompletni syntakticky anotovana data z PDT 2.0?
Michal Sotkovsky
- design
- navrh tak pekny jako CAK 1.0 - pouze zmenit barvicky
Honza Raab
- tagger
- bude umet cist z a zapisovat do PML?
- > ano, bude
- Tagger natrenovat na jakych datech - kompletni morfologicky anotovana data z PDT 2.0?
- > nic jiného k trénování vhodného asi ani nemáme - ale PDT je v některých věcech nekompatibilní s CAK (např. číslovky)
- technicky editor pruvodce
KALENDAR
18.6. v 8:30 probehla schuzka o praci na datech; PRITOMNI: Alla Bemova, Veronika Curdova (anotatorka), Jan Hajic, Barbora Hladka, Jiri Mirovsky, Kiril Ribarov, Zdenka Uresova, Lenka Zehrova (anotatorka)
Udaje psane kurzivou signalizuji splneni.
2007 | duben | kveten | cerven | cervenec | srpen | zari | rijen | listopad | prosinec |
---|---|---|---|---|---|---|---|---|---|
Bara | zahajit komunikaci s LDC (spolu s Honzou H.) | - | do 20. cervna odevzdat 'naplnene' xml soubory; 18.6. 8:30 schuzka o datech | 1. verze Pruvodce | - | - | - | - | - |
do 17.4. pripravit osnovu Pruvodce - viz cast CO bod 3 | - | - | - | - | - | - | - | - | |
24.4. oslovit ty, kteri budou psat casti Pruvodce | - | - | - | - | - | - | - | - | |
Jirka H. | - | - | do 20. cervna odevzdat 'naplneny' xml soubor | - | - | dodat df verzi LAW pro cd | dodat tutorial k LAW | - | - |
Jarka | - | - | do 20. cervna odevzdat 'naplnene' xml soubory | - | - | dodat df verzi morf. anal. pro cd | dodat tutorial k Bonito | - | - |
Jirka M. | kontrola morf. anotaci | - | do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; 18.6. 8:30 schuzka o datech | - | - | dodat df. verzi Netgraph | dodat tutorial k Netgraph | - | - |
Kiril | prubezne priprava dat pro anotatory | vymyslet strategii pro porovnani souboru od anotatoru | makra do TrEd; 18.6. 8:30 schuzka o datech | - | - | dodat df verzi parseru pro cd | - | - | - |
Honza R. | do 23.4. pripravit xml soubory pro jednotlive casti Pruvodce | - | - | 1. verze Pruvodce | - | dodat df verzi taggeru pro cd | - | - | - |
Pavel Q. | - | - | - | - | - | dodat morfologii pro Bonito | - | - | - |
Ondra B. | - | - | - | - | - | - | - | 1. verze instalatoru | - |
Michal K. | - | - | - | - | - | - | tool_chain | - | - |
Michal S. | - | - | - | - | - | dodat designove podklady | - | - | - |
Ondrej K. | - | - | - | - | - | dodat df verzi STYX pro cd | dodat tutorial k STYX | - | - |
Leos Prikryl | - | - | - | - | - | - | dodat df. verzi TrEdVoice (ve spolupraci s Plzni) | dodat tutorial k TrEdVoice |
POKYNY
Pruvodce
Vsechny potrebne soubory jsou ~/raab/cac-guide
. Protoze nektere odstavce budou totozne s odstavci z Pruvodce CAK 1.0, realizujte 'cut'n paste' ze souboru z adresare cac1/.
cac1/ - finalni verze CAC 1.0 upload/ - oblibeny adresar pro zapis zmenenych souboru pdf/ - aktualni pdf verze
Dokumentace k nastrojum
Adresar nastroje bude mit nasledujici strukturu
- docs/ # uzivatelska dokumentace, instalacni pokyny - cesky I anglicky
- README_{CZ|EN}.txt # cesky a anglicky 'hruba' dokumentace
- instalacni balicek/balicky
Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW
Tutorialy
K nastrojum s grafickym rozhranim, tedy
- Bonito
- LAW
- TrEd
- Netgraph
- Styx
- BB FlashBack Express - viz demo_1
- Wink software - viz demo_2
Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim.
Smysluplnost tutorialu ODSOUHLASENA.
V Pruvodci CAC 2.0 bude rovnez odkaz na PDT tutorial z lonskeho listopadu
PRACE NA DATECH podrobne
Pro anotatory
- Textove materialy k anotaci
- Pokyny pro anotaci (23/6/2007) (CTI ME - shrnuti vsech podstatnych informaci)
- Valencni slovnik z PDT (a k němu manuál k používání pro analytickou anotaci)
- Postrehy z kontroly dvojite anotace textu
- Prehled maker kontextu PML_CAC_A_Edit editoru TrEd
- Slajdy ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)
- Slajdy ze snidane 25/6/2007(informacni schuzka se zajemci o anotovani)
- Mezianotatorska shoda v cislech
- TrEd - instalace pod systémem Windows a základní instrukce
- TrEd je ke stažení ve standardní distribuci (platné i pro anotaci CAC) na jeho “domácích stránkách” na http://ufal.mff.cuni.cz/~pajas/tred.
- Rychlý návod k instalaci (pro “offline” použití; pro anotátory ze SNK instaluje TrEd Radovan jinak):
- Z výše uvedené stránky stáhněte na svůj notebook soubor
tred_wininst_en.zip
. - Rozbalte jej kdekoliv; dostanete adresář
tred_wininst_en
. - V tomto adresáři spusťte soubor
setup.bat
. Pozor, v adresáři je několik podobně pojmenovaných.bat
souborů - vy spusťte tento základní. - Na všechny otázky odpovězte yes (y), nebo tak, aby instalace pokračovala, a nechte pro všechno, co vám instalační program nabízí, defaultní hodnoty.
- Po dokončení instalace spusťte TrEd (pomocí ikony na ploše). Ověřte (Help→About), že se jedná o verzi nejméně 1.3050 nebo vyšší.
- Po ověření verze si nastavte tzv.
stylesheet
, tj. to, co všechno se vám při anotaci zobrazí. Při všech dalších spuštění TrEd se bude zobrazovat to, co jste si nastavili. Zkušenosti říkají, že stačí u uzlu zobrazit slovo a analytickou funkci. Z menuView → Edit Stylesheet
, pravou část okna smažte a vložte následující, které potvrďteok
:
context: .*
hint:
text:<? $${m/w/token}eq$${m/form} ?
'#{'.CustomColor('sentence').'}${m/w/token}' :
'#{-over:1}#{'.CustomColor('spell').'}['.
join(“ ”,map { $_→{token} } ListV($this→attr('m/w'))).
']#{-over:0}#{'.CustomColor('sentence').'}${m/form}' ?>
node:<? $${afun} eq “AuxS” ? '${id}' : '${m/form}' ?>
node:<?$${afun}?>
- Rychlý návod ke spuštění TrEdu a anotaci (otevření souboru a nastavení prostředí, anotace)
- Spusťte TrEd, a pomocí
Open
(nebo zRecent Files
) otevřete příslušný.a
soubor. - Nastavte “kontext” (vpravo nahoře)
PML_CAC_A_Edit
. - Používejte makra z
PML_CAC_A_Edit
(User-defined → PML_CAC_A_Edit
, příp.More
) a dále smíte používatOpen
,Save
,Save As
z hlavního menuFile
, a všechny další funkce, které slouží k “prohlížení” souboru(ů) - například posouvání po větách, přímý skok na větu s daným pořadovým číslem (tj. různáGoTo
…), vyhledávání v souboru pomocí F3/F4 apod. NIKDY ale nepoužívejte jakékoli funkce, které mění strom nebo hodnoty atributů z menuNode
, ani z makerTred_Macro
nebo jiných maker a kontextů. - První uložení souboru po jeho prvním otevření a zahájení jeho anotace
- Soubor se ukládá pomocí
Save As
(menuFile
), pak zvolte“Current”
v okně pro volbu formátu. - Soubor uložte pod původním jménem s přidaným podtržítkem a iniciálami vašeho jména; postup: zvolte původní soubor s koncovkou
.a
v nabízeném seznamu, a přidejte mu před.a
ješte_JP
(J
- inicála jména,P
- iniciála příjmení). - Po odsouhlasení jména na vás vyskočí okno
“Select resources to save”
. Klikněte na první řádek (soubor s příponou.m
) - měl by se vysvítit. Pak zvolte tlačítko“Change Filename”
, a rovněž u tohoto souboru připište k jeho jménu“_JP”
(těsně před příponu.m
, obdobně jako u.a
souboru). Po odsouhlasení zkontrolujte, že v okně“Select resources to save”
je jméno správně upravené (s tím_JP
). Odsouhlaste uložení tlačítkem“OK”
.
- Další otevření a uložení částečně anotovaného nebo dodatečně opravovaného souboru
- Pro druhé a další otevření téhož souboru pro provádění další anotace nebo jakýchkoli jiných změn použijte soubor s modifikovaným jménem (
…._JP.a
). - Pro jeho uložení po provedení změn použijte
File → Save
(F2). - V okne
“Select resources to save”
klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s_JP.m
na konci). Hned poté odsouhlaste uložení pomocí tlačítka“OK”
(tedy není nutno znovu měnit jméno souboru pomocíChange Filename
).
Interni adresarova struktura
- 18.6. 8:30 schuzka o datech
- Vytvoření adresářové struktury v
/net/projects/REST/data/CAC/work_CAC20/data
s dále uvedenými podadresáři. - Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře (aktualizováno po schůzce 24.9.2007):
00_actual
- aktuální .w a .m data celého korpusu (Jiří Mírovský)- odtud bude brát Kiril data a pouštět na ně parser
01_MST_Parsed
- sem umístí Kiril vždy nově zparsovaný korpus (kdykoliv ho bude nově parsovat), do podadresáře pojmenovaného podle data (Kiril Ribarov)- odtud si bude Jirka brát data a pustí na ně automatické kontrolní skripty
02_auto_check_A
- první fáze automatických kontrol (Jiří Mírovský)- odtud bude Bára brát data a rozdělovat práci anotátorkám
03_2annotations
- anotace souborů jednotlivými anotátorkami (Kiril Ribarov)- data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné
04_comparison
- porovnání a slití souborů do jedné verze (Kiril Ribarov)- odtud si vezme data Jirka a znovu na ně spustí kontrolní skripty
05_auto_check_B
- druhá fáze automatických kontrol (Jiří Mírovský)- odtud vezme data Kiril a dá je paní Bémové ke kontrole
06_manual_check
- sem dá Kiril data poté, co jsou zkontrolována paní Bémovou (Kiril Ribarov)- odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; vezme si odtud data a znovu na ně spustí kontrolní skripty
07_auto_check_C
- třetí fáze automatických kontrol; analytická rovina se považuje už za správnou, Jirka ručně opraví morfologii (Jiří Mírovský)- odtud dá Jirka data do následujícího adresáře, je hotovo
08_finished
- tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová .w a .m data se budou kopírovat rovněž do adresáře00_actual
, aby se odtud v případě potřeby mohla brát (.w by se měnit nemělo) (Jiří Mírovský, Kiril Ribarov)_schemas
- aktuální PML-schémata potřebná k otevření souborů ve výše uvedených adresářích
- Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim
- Jirka Mirovsky
- brat a-soubory z adresare
net/projects/rest/data/CAC/atrees/MST2/odAlly
(popis viz nize) - k 3/6 umisteny souborty
s11-s16
- Priprava dat k dvojite rucni syntakticke anotaci
- Kiril - zpracovani dat MST parserem
- podpora v TrEdu pro snadnejsi anotaci: pro anotovani PDT 1.0 byla v TrEd nabizena makra pro prijemnejsi anotaci. Tato makra byla napsana pro format fs a jeste pro koncepci PDT 1.0, ktera se v nekterych ohledech lisi od te v PDT 2.0 (napr. viz koordinace). Kdyz se v soucasne distribuci TrEd nastavi kontext Analytic, tak ten nabizi prave zminena makra.
12/6/2007
Kirile,
tady preposilam soubor PML_A_Edit.mak a k nemu prilohu od Katky. Radovan jim tato makra udelal primo do PML_A_Edit, coz neni dobre, protoze tim padem my a oni mame jiny PML_A_Edit. Je potreba to udelat “spravne” (tj.v duchu PML schemat) - nechat PML_A_Edit byt, a udelat novy (napr. pojmenovany PML_CAC_A_Edit), ktery “includuje” vsechna makra z PML_A_Edit, a ty specificka pro
anotaci CAC (vc. afunu, koordinaci apod.) prida prave do nej. Myslim, ze taky bude dobre, aby cesti anotatori a slovaci meli ted vsechno stejne - takze az to budes mit, posli to prosim zpet
Radovanovi at jim to nainstaluje. Jinak jsem dnes odpodival na nekolik dotazu ohledne 2. kola;
myslim, ze nejdulezitejsi je, abys jim poslal doplnene pokyny o tom, co smeji a nesmeji pouzivat.
Diky, Honza
- Rucni kontrola syntaktickych anotaci
- data po rucni anotaci v adresari
net/projects/rest/data/CAC/atrees/MST2/odAnotatoru
- Kiril - do TrEdu udelatka pro pohodlnejsi kontrolu diskrepanci
- Alla - resit diskrepance anotatoru
- data po Alline kontrole v adresari
net/projects/rest/data/CAC/atrees/MST2/odAlly
- Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci
- Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v
net/projects/rest/data/CAC/atrees/MST2/odAlly
), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas. Dulezite poznamky uvadej zde.
Soubory - prehled JIZ zpracovanych v danem kole
jmeno souboru | 1. kolo (03_2annotations ) | 2. kolo (06_manual_check ) |
---|---|---|
a01w | ab | ab |
a02w | ab | ab |
a03w | ab | ab |
a04w | ||
a05w | ||
a06w | ||
a07w | ||
a08w | ||
a09w | ||
a10w | ||
a11w | ||
a12w | ||
a13w | ||
a14w | ||
a15w | ||
a16s | ||
a17s | ||
a18s | ||
a19s | ||
a20w |
jmeno souboru | 1. kolo (03_2annotations ) | 2. kolo (06_manual_check ) |
---|---|---|
n01w | ab | ab |
n02w | ab | ab |
n03w | ik | ab |
n04w | ik | ab |
n05w | ik | ab |
n06w | ik | ab |
n07w | ik | ab |
n08w | ik | ab |
n09w | ik | |
n10w | ik | |
n11w | ik | |
n12w | ik | |
n13w | ik | ab* |
n14w | ik | ab* |
n15w | ik | ab* |
n16w | ik | ab* |
n17w | ik | ab* |
n18w | ik | ab* |
n19w | ik | ab* |
n20w | ik | ab* |
n21w | ik | ab* |
n22w | ik | ab* |
n23w | ik | ab* |
n24w | ik | ab* |
n25w | ||
n26w | ||
n27w | ||
n28w | ||
n29w | ||
n30w | ||
n31w | ||
n32w | ||
n33w | ||
n34w | ||
n35w | ||
n36w | ||
n37w | ||
n38w | ||
n39w | ||
n40w | ||
n41w | ||
n42w | ||
n43w | ||
n44w | ||
n45w | ||
n46w | ||
n47w | ||
n48w | ||
n49w | ||
n50w | ||
n51w | ||
n52w | ||
n53s | ||
n54s | ||
n55s | ||
n56s | ||
n57s | ||
n58s | ||
n59s | ||
n60s |
jmeno souboru | 1. kolo (03_2annotations ) | 2. kolo (06_manual_check ) |
---|---|---|
s00s | ||
s01w | ab | ab |
s02w | ab | ab |
s03w | kg,kk | ab |
s04w | kg,kk | ab |
s05w | kg,kk | ab |
s06w | kg,kk | ab |
s07w | kg,kk | ab |
s08w | kg,kk | ab |
s09w | kg,kk | ab |
s10w | kg,kk | ab |
s11w | ab | ab |
s12w | ab | ab |
s13w | ab | ab |
s14w | ab | ab |
s15w | ab | ab |
s16w | ab | ab |
s17w | sk | ab |
s18w | sk | ab |
s19w | sk | ab |
s20w | sk | ab |
s21w | sk | ab |
s22w | sk | ab |
s23w | sk | ab |
s24w | sk | ab |
s25w | sk | ab |
s26w | sk | ab |
s27w | sk | ab |
s28w | sk | ab |
s29w | sk | ab |
s30w | sk | ab |
s31w | kk,kg | |
s32w | kk,mz | |
s33w | kk,mz | |
s34w | kk,kg | |
s35w | kg,mz | |
s36w | kk,mz | |
s37w | kk,kg | |
s38w | kg,mz | |
s39w | kk,mz | |
s40w | kk,kg | |
s41w | kk | |
s42w | kk | |
s43w | kk | |
s44w | kk | |
s45w | kk | |
s46w | mz | |
s47w | mz | |
s48w | mz | |
s49w | mz | |
s50w | mz | |
s51w | ||
s52w | ||
s53w | ||
s54w | ||
s55w | ||
s56w | kk | |
s57w | kk | |
s58w | kk | |
s59w | kk | |
s60w | kk | |
s61w | ||
s62w | ||
s63w | ||
s64w | ||
s65w | ||
s66w | ||
s67w | ||
s68w | ||
s69s | ||
s70s | ||
s71s | ||
s72s | ||
s73s | ||
s74s | ||
s75s | ||
s76s | ||
s77s | ||
s78s | ||
s79s | ||
s80s | ||
s81s | ||
s82s | ||
s83s | ||
s84s | ||
s85s | ||
s86s | ||
s87s | ||
s88s | ||
s89s | ||
s90s | ||
s91s | ||
s92s | ||
s93s | ||
s94s | ||
s95s | ||
s96s | ||
s97s | ||
s98s | ||
s99s |
KONTAKTY
- Alla Bemova (
bemova@ufal.mff.cuni.cz
, kontrola anotaci) - Katarina Gajdosova (
katarinag@korpus.juls.savba.sk
, sk, anotatorka) - Jan Hajic (
hajic@ufal.mff.cuni.cz
) - Barbora Hladka (
hladka@ufal.mff.cuni.cz
) - Katarína Kandračová (sk, )
- Jirka Mirovsky (
mirovsky@ufal.mff.cuni.cz
) - Kiril Ribarov (
ribarov@ufal.mff.cuni.cz
, TrEd) - Zdenka Uresova (
uresova@ufal.mff.cuni.cz
, kontrola anotaci) - MZ