[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:hladka:smerem-k-cak-2.0 [2007/09/18 13:40]
hladka
user:hladka:smerem-k-cak-2.0 [2008/12/12 12:21] (current)
hladka
Line 1: Line 1:
 ====== CAK 2.0 ====== ====== CAK 2.0 ======
- 
- 
- 
- 
- 
- 
  
  
Line 17: Line 11:
  
 ===== Aktuality ====== ===== Aktuality ======
-   * **24/9/07 v 9:00 schuzka k CAK 2.0** - PROGRAM+   * **28/04/2008** //Podivejte se prosim na anglickou verzi Pruvodce jak ve formatu html, tak i v pdf. Abych tak rekla ... nemusi to byt vylozene systematicky (napr. ze si vytisknete pdf a cele ho prectete), protoze kdyz se na text podiva nekdo, kdo ho cele noci needitoval, tak jeho prvni pohled padne na nejaky nedostatek:-( Komentare posilejte Honzovi Raabovi s Cc: hladka. Ucinte tak prosim nejpozdeji ve stredu 30. 4. - opravdu uz finisujeme, na zacatku kvetna odchazi CD-ROM do LDC.// 
 +      * anglicke [[http://ufal.mff.cuni.cz/morce/cac/index_en.php|html]] 
 +      * anglicke [[http://ufal.mff.cuni.cz/~hladka/CAC20/en_cac-guide.pdf|pdf]] 
 +   * **18/12/07** **REKAPITULACE roku 2007**, **aktulizace ke dni 7. 1. 2008** 
 +      * Pruvodce CAK 2.0 
 +         * ceska verze DOKONCENO 
 +         * anglicka verze PRACUJE SE NA NI 
 +      * CD-ROM 
 +         * data PRACUJE SE NA NICH 
 +         * nastroje 
 +            * zrevidovat soubory README 
 +            * Bonito - zavisi na datech 
 +            * LAW - DOKONCENO 
 +            * Netgraph - DOKONCENO (až na přiložená data ve formátu fs, která jsou zatím neúplná) 
 +            * TrEd - DOKONCENO 
 +            * tool_chain - LADI SE, otaznik u konverze pml w-soubor <-> csts 
 +               * do souboru README napsat verze nastroju, na jakych datech byly natrenovany, e-mailove odkazy 
 +               * tokenizace - dokumentace? 
 +               * morfologicka analyza - dokumentace? 
 +               * tagger 
 +               * parser 
 +         * bonusy 
 +            * STYX - DOKONCENO 
 +            * TrEdVoice - DOKONCENO    
 +         * tutorialy 
 +            * Bonito - DOKONCENO - jsou tam jeste nejake otazniky - viz vyse 
 +            * Netgraph - DOKONCENO 
 +            * TrEdVoice - DOKONCENO 
 +            * LAW - DOKONCENO 
 +            * TrEd - DOKONCENO 
 +            * STYX - DOKONCENO 
 +   * **23/11/07** 
 +      * Pruvodce CAK 2.0 ([[http://ufal.mff.cuni.cz/~hladka/CAC20/cac-guide.pdf|pdf]],                          [[http://ufal.mff.cuni.cz/morce/cac|html]]) 
 +         * Pruvodce je uz v takove fazi, ze je vhodne, abyste si ho precetli 
 +         * Prosim o korektury - korektury zaneste do vytisteneho Pruvodce. Byla bych moc rada, kdybyste je stihli do patku 30. listopadu t.r. (prijdu si pro ne:-))Nektere obrazky z pdf vypadly, podivejte se na ne v html (diky). 
 +      * Prosim o komentar k demosnimkum, ktere najdete v ''/net/projects/rest/CAC/cac20/tutorials'' (jeste chybi demosnimek k TrEd - Petr Pajas udela; STYX - chybi df. verze STYX, LAW) Komentare prosim piste primo sem na wiki. 
 +         * Nethraph 
 +            * JM: libi se;-) 
 +            * BH: moc rychly, komentare k dotazum; aktualizace JM: zpomalil jsem to o 10% a pridal komentar ke strukturnimu dotazu 
 +         * Bonito 
 +            * BH: moc velka obrazovka, doplnit uvod a zaver 
 +            * JM: libi se, u frekvencni distribuce obe sipky oznaceny VPRED 
 +         * TredVoice 
 +            * BH: libi se mi 
 +            * JM: libi se 
 +         * Styx 
 +         * TrEd   
 +      * Prosim o testovani skriptu ''tool_chain'' (''/net/projects/rest/CAC/cac20/tools/tool_chain''). Komentar posilejte primo Michalovi Kebrtovi (''michalek.k@seznam.cz''     
 +   * **24/9/07 v 9:00 schuzka k CAK 2.0. chodba ve 4. patre zapadniho kridla** - body pgmu, ktere jsme probrali, jsem presunula na patricna mista wiki dokumentace
       * CAK 1.0       * CAK 1.0
-         * //Jak se vam libi Pruvodce CAK 1.0?// +         * Rozesilani Pruvodce - Zatim jsem koupila 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene v [[http://ufal.mff.cuni.cz/~hladka/CAC20/stitky-korpusy.rtf|prilozenem souboru]] vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim.
-         * Rozesilani Pruvodce - //Koupila jsem 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene v [[http://ufal.mff.cuni.cz/~hladka/CAC20/stitky-korpusy.rtf|prilozenem souboru]] vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim. //+
       * Pruvodce CAK 2.0       * Pruvodce CAK 2.0
-         * aktualni verze: [[http://ufal.mff.cuni.cz/morce/cac|html]] (//Podivejte se na barvy.//) +         * aktualni verze: [[http://ufal.mff.cuni.cz/morce/cac|html]]     
-      * CD-ROM CAK 2.0 +            * //Zatim neni nutne cist Pruvodce jako celekJeste udelame jedno kolo zmen/doplnku/...// 
-         * //Bude samostatny tokenizer?// +            * //Podivejte se na barvy.// 
-         * //Bude 'nova' morfologicka analyza?// +    * **19/7/07**
-         * tool_chain. //S jakymi prepinaci? Prvotni navrh viz [[http://ufal.mff.cuni.cz/morce/cac/?chapter=3#nastroje-zprac|tab. 3.9]] +
-         * //Co z Netgraph na CD?// +
-         * Instalace. //Jake balicky? Kontrola [[http://ufal.mff.cuni.cz/morce/cac/?chapter=6|tabulky 6.1]]// +
-         * TrEdVoice. //Kam? Proberu s Leosem Prikrylem.// +
-   * **19/7/07**+
       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])
       * podepsana smlouva mezi UK MFF a LDC       * podepsana smlouva mezi UK MFF a LDC
Line 42: Line 78:
          * dohoda UK MFF <-> LDC PODEPSANA          * dohoda UK MFF <-> LDC PODEPSANA
          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== CD ROM ===== ===== CD ROM =====
 +Adresar ''/net/projects/REST/data/CAC/cac20'' je nasim 'ladicim' adresarem. //Az budete mit nastroje nachystane v nejake verzi (nemusi byt definitivni), tak je ulozte do spravneho adresare - abychom mohli zvolna zacit ladit.//
    * bonus-tracks/    * bonus-tracks/
       * STYX/       * STYX/
-      * TrEdVoice/+      * TrEdVoice/ ## //Kam presne prijde TrEdVoice? K TrEd? //
    * data/    * data/
-      * format: PML+      * format: PML, CSTS ## 
    * tools/    * tools/
       * Bonito/        * Bonito/ 
       * LAW/        * LAW/ 
-      * TrEd/  +      * TrEd/ ## // Filelist se seznamem 180 souboru CAK 2.0 /
-      * Netgraph/+      * Netgraph/ ## Klient i server.
       * tool_chain/       * tool_chain/
-         * tokenizer/ +         * tokenizer/ ##  
-         * morphology/+         * morphology/ ## // I SLED?//
          * tagger/          * tagger/
-         * parser/ +         * parser/ ## //Mozne problemy velikost natrenovaneho modulu, vypocetni pametove naroky(KR)// 
-         * tool_chain tATP +         tool_chain
-            * -t ... tokenizer +
-            * -A ... morfologicka analyza +
-            * -T ... tagging +
-            * -AT ... morf. analyza nasledne tagging +
-            * -P ... parsing +
-            -tATP - run it all+
     * tutorials/     * tutorials/
 +
 +
 +
 +
  
 ===== Pruvodce ===== ===== Pruvodce =====
Line 76: Line 121:
             - Zdroje textu             - Zdroje textu
             - Roviny anotace             - Roviny anotace
 +            - Vyvoj projektu
 +               - CAK 1.0
 +               - Na ceste k CAK 2.0
 +                  * // Tabulka 2.2 - upravy (ktere BH, realizace JR)//
 +                  * // Doplnit popis pilotni studie (KR)//
 +                  * // Jake dalsi morf. kontroly se delaly, upozornit na guessed-form. (JM)//
 +                  * //Doplnit logistiku syntaktickych kontrol. (KR, JM)//
             - Kvantitativni udaje             - Kvantitativni udaje
          - CD-ROM Cesky akademicky korpus 2.0          - CD-ROM Cesky akademicky korpus 2.0
             - Adresarova struktura (**BH, adresar.xml**)             - Adresarova struktura (**BH, adresar.xml**)
 +               * //Doplnit kam prijde TrEdVoice.//
 +               * //Ohlidat info o tokenizaci.//
             - Data (**Jirka M., data.xml**)             - Data (**Jirka M., data.xml**)
-               - Format dat+               - Format dat 
                - Konvence pojmenovani souboru                - Konvence pojmenovani souboru
                - Velikost dat                - Velikost dat
-            - Nastroje+            - Nastroje //U kazdeho nastroje uvest odkaz do kapitoly Tutorialy.//
                - Bonito (**Jarka, nastroje-bonito.xml**)                - Bonito (**Jarka, nastroje-bonito.xml**)
 +                  * //Doplnit dotazy na linearni vyhledavani ve stromove strukture.//
 +                  * //Obrazek 3.3 nahradit obrazovkou se vsemi atributy CAK 2.0.//
 +                  * //Tabulka 3.7 cara mezi sloupci, mezi radky.//
 +                  * //Tabulku 3.7 ilustrovat - nakreslit strom a u kazdeho uzlu zobrazit hodnoty vsech atributu uvedenych v tabulce a doplnit nejaky dotaz primo v Bonito.//
                - LAW (**Jirka H., nastroje-law.xml**)                - LAW (**Jirka H., nastroje-law.xml**)
                - TrEd (**XY, nastroje-tred.xml**)                - TrEd (**XY, nastroje-tred.xml**)
 +                  * //Doplnit (BH) //
                - Netgraph (**Jirka M., nastroje-netgraph.xml**)                - Netgraph (**Jirka M., nastroje-netgraph.xml**)
 +                  * Spravny spelling je **Netgraph**.
                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)
 +                  * // Doplnit odstavec o tokenizaci, pokud tam bude.//
 +                  * // Aktualizovat procenta uspesnosti u taggeru.//
 +                  * // Specifikovat na jakych datech PZK 2.0 byl tagger trenovan.//
 +                  * // Doplnit odstavec o parsingu (uspesnost, trenovaci data).// 
 +                  * // Popsat prepinace u tool_chain//
             - Bonusovy material (**bonus.xml**)             - Bonusovy material (**bonus.xml**)
 +               * //Doplnit ilustracni obrazek, neco vice k rozpoznavaci, doplnit citace. (BH)//
             - Tutorialy (**BH, tutorialy.xml**)             - Tutorialy (**BH, tutorialy.xml**)
-           - Instalace (**BH, instalace.xml**)+            - Instalace (**BH, instalace.xml**) 
 +            - Distribuce a licence (**BH, distribuce.xml**)
          - Osobnosti v projektu (**BH, osobnosti.xml**)          - Osobnosti v projektu (**BH, osobnosti.xml**)
          - Podekovani (**BH, podekovani.xml**)          - Podekovani (**BH, podekovani.xml**)
          - Literatura (**BH, literatura.xml**)          - Literatura (**BH, literatura.xml**)
          - Priloha A Zdroje textu (**BH, zdroje.xml**)          - Priloha A Zdroje textu (**BH, zdroje.xml**)
-         - Priloha B Pavucina (**BH, pavucina.xml**) +         - Priloha B Popis lemmat (**BH, lemmata.xml**) 
-         - Priloha C Popis lemmat (**BH, lemmata.xml**) +         - Priloha C Popis morfologickych znacek (**BH, znacky.xml**) 
-         - Priloha D Popis morfologickych znacek (**BH, znacky.xml**) +         - Priloha D Popis analytickych funkci (**BH, funkce.xml**) 
-         - Priloha E Popis analytickych funkci (**BH, funkce.xml**)+         - Priloha E Pavucina (**BH, pavucina.xml**) 
 ===== Design ===== ===== Design =====
       * CD, plakat, web       * CD, plakat, web
Line 180: Line 248:
  
    * technicky editor pruvodce    * technicky editor pruvodce
 +
 +
 +
 +
 +
 +
 +
 +
  
 ====== KALENDAR ====== ====== KALENDAR ======
Line 191: Line 267:
 ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-| ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-|
 ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-| ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-|
-^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|dodat df verzi morf. anal. pro cd|dodat tutorial k Bonito|-|-| +^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|//dodat df verzi morf. anal. pro cd//|//dodat tutorial k Bonito//|-|-| 
-^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|-|dodat tutorial k Netgraphy|-|-| +^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|//dodat df. verzi Netgraph//|//dodat tutorial k Netgraph//|-|-| 
-^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|dodat df verzi parseru pro cd|-|-|-| +^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|//dodat df verzi parseru pro cd//|-|-|-| 
-^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|1. verze Pruvodce|-|dodat df verzi taggeru pro cd|-|-|-|+^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|//1. verze Pruvodce//|-|//dodat df verzi taggeru pro cd//|-|-|-|
 ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-| ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-|
 ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-| ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-|
-^ Michal K.     |-|-|-|-|-|-|morph-parse-chain|-|-| +^ Michal K.     |-|-|-|-|-|-|//tool_chain//|-|-| 
-^ Michal S.     |-|-|-|-|-|dodat designove podklady|-|-|-|+^ Michal S.     |-|-|-|-|-|//dodat designove podklady//|-|-|-|
 ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-| ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-|
 +^ Leos Prikryl     |-|-|-|-|-|-|//dodat df. verzi TrEdVoice (ve spolupraci s Plzni)//|//dodat tutorial k TrEdVoice//|
  
 ====== POKYNY ====== ====== POKYNY ======
Line 221: Line 298:
  
 Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW
 +
 +
  
 ===== Tutorialy ===== ===== Tutorialy =====
Line 235: Line 314:
 Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim.  Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim. 
  
-Smysluplnost tutorialu ODSOUHLASENA. (Jeste vas prosim o nazor, jestli vidite takoveto tutorialy smysluplne, tedy smysluplne na to, abychom je dali na cd CAC 2.0. Ja si myslim, ze to smysl ma. )+Smysluplnost tutorialu ODSOUHLASENA.
  
 V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu
 +
 +
  
 ====== PRACE NA DATECH podrobne ====== ====== PRACE NA DATECH podrobne ======
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== Pro anotatory ===== ===== Pro anotatory =====
Line 245: Line 336:
       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})
 +      * [[http://ufal.mff.cuni.cz/~hladka/CAC20/poznamky_od_AB.pdf|Postrehy]] z kontroly dvojite anotace textu
 +        * Jan Štěpánek: [[:cak:poznamky|poznámky]]
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)
Line 284: Line 377:
             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').
    
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== Interni adresarova struktura ===== ===== Interni adresarova struktura =====
-   * 18.6. 8:30 schuzka o datech; výsledek schůzky:+   * 18.6. 8:30 schuzka o datech
       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.
-      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře: +      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře (aktualizováno po schůzce 24.9.2007)
-         * ''00_actual'' - aktuální data celého korpusu (Jiří Mírovský) +         * ''00_actual'' - aktuální .w a .m data celého korpusu (Jiří Mírovský) 
-         * &nbsp; &nbsp; odtud bude brát Kiril data a rozdělovat práci anotátorkám +         * &nbsp; &nbsp; odtud bude brát Kiril data a pouštět na ně parser 
-         * ''01_annotations''anotace souborů jednotlivými anotátorkami (Kiril Ribarov) +         * ''01_MST_Parsed''sem umístí Kiril vždy nově zparsovaný korpus (kdykoliv ho bude nově parsovat), do podadresáře pojmenovaného podle data (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně první sadu "100%" automatických kontrol+         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně automatické kontrolní skripty
          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)
 +         * &nbsp; &nbsp; odtud bude Bára brát data a rozdělovat práci anotátorkám
 +         * ''03_2annotations'' - anotace souborů jednotlivými anotátorkami (Kiril Ribarov)
          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné
-         * ''03_comparison'' - porovnání a slití souborů do jedné verze +         * ''04_comparison'' - porovnání a slití souborů do jedné verze (Kiril Ribarov) 
-         * &nbsp; &nbsp; takto slitá data dá Kiril paní Bémové ke kontrole +         * &nbsp; &nbsp; odtud si vezme data Jirka a znovu na ně spustí kontrolní skripty
-         * ''04_manual_check_1'' - ruční kontrola a oprava nesrovnalostí dvou anotací, případně výstupu skriptů (Kiril Ribarov) +
-         * &nbsp; &nbsp; na ručně prošlá data se pustí další, již méně spolehlivé skripty, které jen upozorňují na podezřelá místa; případně i stopro skripty+
          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)
-         * &nbsp; &nbsp; podezřelá místa pak znovu zkontroluje paní Bémová, když bude tak hodná +         * &nbsp; &nbsp; odtud vezme data Kiril a dá je paní Bémové ke kontrole 
-         * ''06_manual_check_2''ruční kontrola a oprava podezřelých místna která upozornily skripty (Kiril Ribarov) +         * ''06_manual_check''sem dá Kiril data potéco jsou zkontrolována paní Bémovou (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; Kiril navrhuje znovu pustit kontrolní skripty +         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; vezme si odtud data a znovu na ně spustí kontrolní skripty 
-         * ''07_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (Jiří Mírovský, Kiril Ribarov) +         * ''07_auto_check_C'' - třetí fáze automatických kontrol; analytická rovina se považuje už za správnou, Jirka ručně opraví morfologii (Jiří Mírovský) 
-          +         * &nbsp; &nbsp; odtud dá Jirka data do následujícího adresáře, je hotovo 
-   Polo-automaticka kontrola morfologickych anotaci 'sama proti sobe' +         * ''08_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová .w a .m data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (.w by se měnit nemělo) (Jiří Mírovský, Kiril Ribarov) 
-      * Jirka Mirovsky +         * ''_schemas'' aktuální PML-schémata potřebná k otevření souborů ve výše uvedených adresářích          
-      * na kontrolach m-souboru pracuje lokalne u sebe+
    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim
       * Jirka Mirovsky       * Jirka Mirovsky
Line 328: Line 435:
    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci
       * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.**        * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.** 
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +===== Soubory - prehled JIZ zpracovanych v danem kole ===== 
 +^ jmeno souboru    1. kolo (''03_2annotations''      2. kolo (''06_manual_check''         ^ 
 +| a01w    |   ab    ab     
 +| a02w    |   ab    ab     
 +| a03w    |   ab    ab     
 +| a04w    |   kk    zu    | 
 +| a05w    |   mz    ab    | 
 +| a06w    |   kg    ab     
 +| a07w    |   mz    ab    | 
 +| a08w    |   kk    zu     
 +| a09w    |   kg    ab     
 +| a10w    |   kk    zu     
 +| a11w    |   mz    ab    | 
 +| a12w    |   kg    ab     
 +| a13w    |   kk    zu     
 +| a14w    |   mz    ab    | 
 +| a15w    |   kg    ab     
 +| a16s    |    |        | 
 +| a17s    |    |       
 +| a18s    |    |      | 
 +| a19s    |      |        | 
 +| a20w    |   kg     zu     
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| n01w    |  ab    ab     
 +| n02w    |  ab    ab     
 +| n03w    |  ik    ab       
 +| n04w    |  ik    ab     
 +| n05w    |  ik    ab      | 
 +| n06w    |  ik    ab    | 
 +| n07w    |  ik    ab     
 +| n08w    |  ik    ab    | 
 +| n09w    |  ik    ab      | 
 +| n10w    |  ik    ab      | 
 +| n11w    |  ik    ab      | 
 +| n12w    |  ik    ab      | 
 +| n13w    |  ik    ab     
 +| n14w    |  ik    ab      | 
 +| n15w    |  ik    ab      | 
 +| n16w    |  ik    ab      | 
 +| n17w    |  ik    ab    | 
 +| n18w    |  ik    ab   
 +| n19w    |  ik    ab    | 
 +| n20w    |  ik    ab     
 +| n21w    |  ik    ab   
 +| n22w    |  ik    ab    | 
 +| n23w    |  ik    ab    | 
 +| n24w    |  ik    ab    | 
 +| n25w    |  ik    ab      | 
 +| n26w    |  ik    ab    | 
 +| n27w    |  ik    ab     
 +| n28w    |  ik    ab   
 +| n29w    |  ik    ab      | 
 +| n30w    |  ik    ab      | 
 +| n31w    |  ik    ab      | 
 +| n32w    |  ik    zu      | 
 +| n33w    |  ik    zu     
 +| n34w    |  ik  |   zu     
 +| n35w    |  ik  |   zu     
 +| n36w    |  ik  |   ab     
 +| n37w    |  ik  |   ab    | 
 +| n38w    |  ik  |   ab   
 +| n39w    |  ik  |   ab     
 +| n40w    |  ik  |   ab      | 
 +| n41w    |  ik  |   ab      | 
 +| n42w    |  ik  |   ab    | 
 +| n43w    |  ik  |   ab    | 
 +| n44w    |  kk  |   zu   
 +| n45w    |  kg  |   zu   
 +| n46w    |  mz  |   zu 
 +| n47w    |  kk  |   zu   
 +| n48w    |  kg  |   ab   
 +| n49w    |  mz  |   zu 
 +| n50w    |  mz  |   ab   
 +| n51w    |  mz  |   zu    | 
 +| n52w     kg  |   ab     
 +| n53s      |       
 +| n54s              | 
 +| n55s    |    |        | 
 +| n56s    |    |        | 
 +| n57s      |       
 +| n58s      |      | 
 +| n59s              | 
 +| n60s        |        | 
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| s00s    |               |
 +| s01w    |  ab    ab     
 +| s02w    |  ab    ab     
 +| s03w    |  kg,kk    ab       
 +| s04w    |  kg,kk    ab     
 +| s05w    |  kg,kk    ab      | 
 +| s06w    |  kg,kk    ab    | 
 +| s07w    |  kg,kk    ab     
 +| s08w    |  kg,kk    ab    | 
 +| s09w    |  kg,kk    ab      | 
 +| s10w    |  kg,kk    ab      | 
 +| s11w    |  ab    ab      | 
 +| s12w    |  ab    ab      | 
 +| s13w    |  ab    ab     
 +| s14w    |  ab    ab    | 
 +| s15w    |  ab    ab   
 +| s16w    |  ab    ab   
 +| s17w    |  sk    ab    | 
 +| s18w    |  sk    ab    | 
 +| s19w    |  sk    ab      | 
 +| s20w    |  sk    ab      | 
 +| s21w    |  sk    ab     
 +| s22w    |  sk    ab     
 +| s23w    |  sk    ab     
 +| s24w    |  sk    ab     
 +| s25w    |  sk    ab     
 +| s26w    |  sk    ab    | 
 +| s27w    |  sk    ab     
 +| s28w    |  sk    ab    | 
 +| s29w    |  sk    ab      | 
 +| s30w    |  sk    ab      | 
 +| s31w    |  kk,kg |   ab     
 +| s32w    |  kk,mz |   ab     
 +| s33w    |  kk,mz |   ab    | 
 +| s34w    |  kk,kg |   ab     
 +| s35w    |  kg,mz |   ab     
 +| s36w    |  kk,mz |   ab     
 +| s37w    |  kk,kg |   ab    | 
 +| s38w    |  kg,mz |   ab   
 +| s39w    |  kk,mz |   ab    | 
 +| s40w    |  kk,kg |   ab     
 +| s41w    |  kk    |   ab    | 
 +| s42w    |  kk    |   ab    | 
 +| s43w    |  kk    |   ab     
 +| s44w    |  kk    |   ab    | 
 +| s45w    |  kk    |   ab     
 +| s46w    |  mz    |  zu    | 
 +| s47w    |  mz    |  zu    | 
 +| s48w    |  mz    |  zu    | 
 +| s49w    |  mz    |  zu    | 
 +| s50w    |  mz    |  zu    | 
 +| s51w    |  kg  |    ab    | 
 +| s52w    |  kg     ab     
 +| s53w    |  kg  |    ab   
 +| s54w    |  kg     ab     
 +| s55w    |  kg     ab     
 +| s56w    |  kk     ab     
 +| s57w    |  kk     ab    | 
 +| s58w    |  kk     ab   
 +| s59w    |  kk     ab     
 +| s60w    |  kk     ab     
 +| s61w    |  mz     zu    | 
 +| s62w    |  mz     zu    | 
 +| s63w    |  mz     zu    | 
 +| s64w    |  mz     zu    | 
 +| s65w    |  mz     zu    | 
 +| s66w    |  mz     zu    | 
 +| s67w    |  mz     zu    | 
 +| s68w    |  mz     zu    | 
 +| s69s    |  mz     zu    | 
 +| s70s    |  mz     zu     
 +| s71s    |  kk     zu    | 
 +| s72s    |  kk     zu    | 
 +| s73s    |  kk     zu    | 
 +| s74s    |  kk          | 
 +| s75s    |  kk          | 
 +| s76s    |  kk     zu    | 
 +| s77s    |   kk |       
 +| s78s    |  kk  |      | 
 +| s79s     kk  |        | 
 +| s80s     kk          | 
 +| s81s    |  kg    |       
 +| s82s    |  mz    |       
 +| s83s    |  mz    |       
 +| s84s           
 +| s85s    |  kg  |        | 
 +| s86s    |  |      | 
 +| s87s             
 +| s88s      |      | 
 +| s89s    mz          | 
 +| s90s    |  |        | 
 +| s91s    |    |        | 
 +| s92s              | 
 +| s93s    mz  |       
 +| s94s    mz          | 
 +| s95s    |    |        | 
 +| s96s    |    |        | 
 +| s97s      |       
 +| s98s    kk  |      | 
 +| s99s    mz          | 
 +
 +
 +
  
 ====== KONTAKTY ====== ====== KONTAKTY ======
    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)
-   * Veronika Curdova (''myopie@seznam.cz'', cz, anotatorka) 
    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)
    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')
    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')
-   KK (sk, )+   Katarína Kandračová (sk, )
    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')
    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)
    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)
-   Lenka Zehrova (''z.lenicka@centrum.cz'', cz, anotatorka)+   MZ 
 + 
        

[ Back to the navigation ] [ Back to the content ]