[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:hladka:smerem-k-cak-2.0 [2007/09/18 10:31]
hladka
user:hladka:smerem-k-cak-2.0 [2008/12/12 12:21] (current)
hladka
Line 1: Line 1:
 ====== CAK 2.0 ====== ====== CAK 2.0 ======
 +
 +
 +
 +
  
  
Line 7: Line 11:
  
 ===== Aktuality ====== ===== Aktuality ======
-   * **24/9/07 v 9:00 schuzka k CAK 2.0** - program schuzky+   * **28/04/2008** //Podivejte se prosim na anglickou verzi Pruvodce jak ve formatu html, tak i v pdf. Abych tak rekla ... nemusi to byt vylozene systematicky (napr. ze si vytisknete pdf a cele ho prectete), protoze kdyz se na text podiva nekdo, kdo ho cele noci needitoval, tak jeho prvni pohled padne na nejaky nedostatek:-( Komentare posilejte Honzovi Raabovi s Cc: hladka. Ucinte tak prosim nejpozdeji ve stredu 30. 4. - opravdu uz finisujeme, na zacatku kvetna odchazi CD-ROM do LDC.// 
 +      * anglicke [[http://ufal.mff.cuni.cz/morce/cac/index_en.php|html]] 
 +      * anglicke [[http://ufal.mff.cuni.cz/~hladka/CAC20/en_cac-guide.pdf|pdf]] 
 +   * **18/12/07** **REKAPITULACE roku 2007**, **aktulizace ke dni 7. 1. 2008** 
 +      * Pruvodce CAK 2.0 
 +         * ceska verze DOKONCENO 
 +         * anglicka verze PRACUJE SE NA NI 
 +      * CD-ROM 
 +         * data PRACUJE SE NA NICH 
 +         * nastroje 
 +            * zrevidovat soubory README 
 +            * Bonito - zavisi na datech 
 +            * LAW - DOKONCENO 
 +            * Netgraph - DOKONCENO (až na přiložená data ve formátu fs, která jsou zatím neúplná) 
 +            * TrEd - DOKONCENO 
 +            * tool_chain - LADI SE, otaznik u konverze pml w-soubor <-> csts 
 +               * do souboru README napsat verze nastroju, na jakych datech byly natrenovany, e-mailove odkazy 
 +               * tokenizace - dokumentace? 
 +               * morfologicka analyza - dokumentace? 
 +               * tagger 
 +               * parser 
 +         * bonusy 
 +            * STYX - DOKONCENO 
 +            * TrEdVoice - DOKONCENO    
 +         * tutorialy 
 +            * Bonito - DOKONCENO - jsou tam jeste nejake otazniky - viz vyse 
 +            * Netgraph - DOKONCENO 
 +            * TrEdVoice - DOKONCENO 
 +            * LAW - DOKONCENO 
 +            * TrEd - DOKONCENO 
 +            * STYX - DOKONCENO 
 +   * **23/11/07** 
 +      * Pruvodce CAK 2.0 ([[http://ufal.mff.cuni.cz/~hladka/CAC20/cac-guide.pdf|pdf]],                          [[http://ufal.mff.cuni.cz/morce/cac|html]]) 
 +         * Pruvodce je uz v takove fazi, ze je vhodne, abyste si ho precetli 
 +         * Prosim o korektury - korektury zaneste do vytisteneho Pruvodce. Byla bych moc rada, kdybyste je stihli do patku 30. listopadu t.r. (prijdu si pro ne:-))Nektere obrazky z pdf vypadly, podivejte se na ne v html (diky). 
 +      * Prosim o komentar k demosnimkum, ktere najdete v ''/net/projects/rest/CAC/cac20/tutorials'' (jeste chybi demosnimek k TrEd - Petr Pajas udela; STYX - chybi df. verze STYX, LAW) Komentare prosim piste primo sem na wiki. 
 +         * Nethraph 
 +            * JM: libi se;-) 
 +            * BH: moc rychly, komentare k dotazum; aktualizace JM: zpomalil jsem to o 10% a pridal komentar ke strukturnimu dotazu 
 +         * Bonito 
 +            * BH: moc velka obrazovka, doplnit uvod a zaver 
 +            * JM: libi se, u frekvencni distribuce obe sipky oznaceny VPRED 
 +         * TredVoice 
 +            * BH: libi se mi 
 +            * JM: libi se 
 +         * Styx 
 +         * TrEd   
 +      * Prosim o testovani skriptu ''tool_chain'' (''/net/projects/rest/CAC/cac20/tools/tool_chain''). Komentar posilejte primo Michalovi Kebrtovi (''michalek.k@seznam.cz''     
 +   * **24/9/07 v 9:00 schuzka k CAK 2.0. chodba ve 4. patre zapadniho kridla** - body pgmu, ktere jsme probrali, jsem presunula na patricna mista wiki dokumentace
       * CAK 1.0       * CAK 1.0
-         * Jak se vam libi Pruvodce CAK 1.0? +         * Rozesilani Pruvodce - Zatim jsem koupila 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene [[http://ufal.mff.cuni.cz/~hladka/CAC20/stitky-korpusy.rtf|prilozenem souboru]] vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim
-         * Rozesilani Pruvodce - //z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji jeden z priznaku PDT0, PDT1, PCEDT, PADT, vytiskla je na stitky (v prilozenem souboru jsou cervenea prvnich 15 uz odeslo. Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni) a dejte mi vedet. Realizaci odeslani zajistim. // +      * Pruvodce CAK 2.0 
-   * **19/7/07**+         * aktualni verze: [[http://ufal.mff.cuni.cz/morce/cac|html]]     
 +            * //Zatim neni nutne cist Pruvodce jako celek. Jeste udelame jedno kolo zmen/doplnku/..., // 
 +            * //Podivejte se na barvy.// 
 +    * **19/7/07**
       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])
       * podepsana smlouva mezi UK MFF a LDC       * podepsana smlouva mezi UK MFF a LDC
Line 23: Line 78:
          * dohoda UK MFF <-> LDC PODEPSANA          * dohoda UK MFF <-> LDC PODEPSANA
          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== CD ROM ===== ===== CD ROM =====
 +Adresar ''/net/projects/REST/data/CAC/cac20'' je nasim 'ladicim' adresarem. //Az budete mit nastroje nachystane v nejake verzi (nemusi byt definitivni), tak je ulozte do spravneho adresare - abychom mohli zvolna zacit ladit.//
    * bonus-tracks/    * bonus-tracks/
       * STYX/       * STYX/
-      * TrEdVoice/+      * TrEdVoice/ ## //Kam presne prijde TrEdVoice? K TrEd? //
    * data/    * data/
-      * format: PML+      * format: PML, CSTS ## 
    * tools/    * tools/
       * Bonito/        * Bonito/ 
       * LAW/        * LAW/ 
-      * TrEd/  +      * TrEd/ ## // Filelist se seznamem 180 souboru CAK 2.0 /
-      * Netgraph/+      * Netgraph/ ## Klient i server.
       * tool_chain/       * tool_chain/
-         * tokenizer/ +         * tokenizer/ ##  
-         * morphology/+         * morphology/ ## // I SLED?//
          * tagger/          * tagger/
-         * parser/ +         * parser/ ## //Mozne problemy velikost natrenovaneho modulu, vypocetni pametove naroky(KR)// 
-         * tool_chain tATP +         tool_chain
-            * -t ... tokenizer +
-            * -A ... morfologicka analyza +
-            * -T ... tagging +
-            * -AT ... morf. analyza nasledne tagging +
-            * -P ... parsing +
-            -tATP - run it all+
     * tutorials/     * tutorials/
 +
 +
 +
 +
  
 ===== Pruvodce ===== ===== Pruvodce =====
Line 57: Line 121:
             - Zdroje textu             - Zdroje textu
             - Roviny anotace             - Roviny anotace
 +            - Vyvoj projektu
 +               - CAK 1.0
 +               - Na ceste k CAK 2.0
 +                  * // Tabulka 2.2 - upravy (ktere BH, realizace JR)//
 +                  * // Doplnit popis pilotni studie (KR)//
 +                  * // Jake dalsi morf. kontroly se delaly, upozornit na guessed-form. (JM)//
 +                  * //Doplnit logistiku syntaktickych kontrol. (KR, JM)//
             - Kvantitativni udaje             - Kvantitativni udaje
          - CD-ROM Cesky akademicky korpus 2.0          - CD-ROM Cesky akademicky korpus 2.0
             - Adresarova struktura (**BH, adresar.xml**)             - Adresarova struktura (**BH, adresar.xml**)
 +               * //Doplnit kam prijde TrEdVoice.//
 +               * //Ohlidat info o tokenizaci.//
             - Data (**Jirka M., data.xml**)             - Data (**Jirka M., data.xml**)
-               - Format dat+               - Format dat 
                - Konvence pojmenovani souboru                - Konvence pojmenovani souboru
                - Velikost dat                - Velikost dat
-            - Nastroje+            - Nastroje //U kazdeho nastroje uvest odkaz do kapitoly Tutorialy.//
                - Bonito (**Jarka, nastroje-bonito.xml**)                - Bonito (**Jarka, nastroje-bonito.xml**)
 +                  * //Doplnit dotazy na linearni vyhledavani ve stromove strukture.//
 +                  * //Obrazek 3.3 nahradit obrazovkou se vsemi atributy CAK 2.0.//
 +                  * //Tabulka 3.7 cara mezi sloupci, mezi radky.//
 +                  * //Tabulku 3.7 ilustrovat - nakreslit strom a u kazdeho uzlu zobrazit hodnoty vsech atributu uvedenych v tabulce a doplnit nejaky dotaz primo v Bonito.//
                - LAW (**Jirka H., nastroje-law.xml**)                - LAW (**Jirka H., nastroje-law.xml**)
                - TrEd (**XY, nastroje-tred.xml**)                - TrEd (**XY, nastroje-tred.xml**)
 +                  * //Doplnit (BH) //
                - Netgraph (**Jirka M., nastroje-netgraph.xml**)                - Netgraph (**Jirka M., nastroje-netgraph.xml**)
 +                  * Spravny spelling je **Netgraph**.
                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)
 +                  * // Doplnit odstavec o tokenizaci, pokud tam bude.//
 +                  * // Aktualizovat procenta uspesnosti u taggeru.//
 +                  * // Specifikovat na jakych datech PZK 2.0 byl tagger trenovan.//
 +                  * // Doplnit odstavec o parsingu (uspesnost, trenovaci data).// 
 +                  * // Popsat prepinace u tool_chain//
             - Bonusovy material (**bonus.xml**)             - Bonusovy material (**bonus.xml**)
 +               * //Doplnit ilustracni obrazek, neco vice k rozpoznavaci, doplnit citace. (BH)//
             - Tutorialy (**BH, tutorialy.xml**)             - Tutorialy (**BH, tutorialy.xml**)
-           - Instalace (**BH, instalace.xml**)+            - Instalace (**BH, instalace.xml**) 
 +            - Distribuce a licence (**BH, distribuce.xml**)
          - Osobnosti v projektu (**BH, osobnosti.xml**)          - Osobnosti v projektu (**BH, osobnosti.xml**)
          - Podekovani (**BH, podekovani.xml**)          - Podekovani (**BH, podekovani.xml**)
          - Literatura (**BH, literatura.xml**)          - Literatura (**BH, literatura.xml**)
          - Priloha A Zdroje textu (**BH, zdroje.xml**)          - Priloha A Zdroje textu (**BH, zdroje.xml**)
-         - Priloha B Pavucina (**BH, pavucina.xml**) +         - Priloha B Popis lemmat (**BH, lemmata.xml**) 
-         - Priloha C Popis lemmat (**BH, lemmata.xml**) +         - Priloha C Popis morfologickych znacek (**BH, znacky.xml**) 
-         - Priloha D Popis morfologickych znacek (**BH, znacky.xml**) +         - Priloha D Popis analytickych funkci (**BH, funkce.xml**) 
-         - Priloha E Popis analytickych funkci (**BH, funkce.xml**)+         - Priloha E Pavucina (**BH, pavucina.xml**) 
 ===== Design ===== ===== Design =====
       * CD, plakat, web       * CD, plakat, web
Line 161: Line 248:
  
    * technicky editor pruvodce    * technicky editor pruvodce
 +
 +
 +
 +
 +
 +
 +
 +
  
 ====== KALENDAR ====== ====== KALENDAR ======
Line 172: Line 267:
 ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-| ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-|
 ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-| ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-|
-^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|dodat df verzi morf. anal. pro cd|dodat tutorial k Bonito|-|-| +^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|//dodat df verzi morf. anal. pro cd//|//dodat tutorial k Bonito//|-|-| 
-^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|-|dodat tutorial k Netgraphy|-|-| +^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|//dodat df. verzi Netgraph//|//dodat tutorial k Netgraph//|-|-| 
-^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|dodat df verzi parseru pro cd|-|-|-| +^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|//dodat df verzi parseru pro cd//|-|-|-| 
-^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|1. verze Pruvodce|-|dodat df verzi taggeru pro cd|-|-|-|+^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|//1. verze Pruvodce//|-|//dodat df verzi taggeru pro cd//|-|-|-|
 ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-| ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-|
 ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-| ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-|
-^ Michal K.     |-|-|-|-|-|-|morph-parse-chain|-|-| +^ Michal K.     |-|-|-|-|-|-|//tool_chain//|-|-| 
-^ Michal S.     |-|-|-|-|-|dodat designove podklady|-|-|-|+^ Michal S.     |-|-|-|-|-|//dodat designove podklady//|-|-|-|
 ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-| ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-|
 +^ Leos Prikryl     |-|-|-|-|-|-|//dodat df. verzi TrEdVoice (ve spolupraci s Plzni)//|//dodat tutorial k TrEdVoice//|
  
 ====== POKYNY ====== ====== POKYNY ======
Line 202: Line 298:
  
 Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW
 +
 +
  
 ===== Tutorialy ===== ===== Tutorialy =====
Line 216: Line 314:
 Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim.  Pro demo_1 k STYX jsem pouzila BB FlashBack Express, ktery bylo mozne ziskat zdarma. K tomu, aby se primo do tutorialu daly vkladat poznamky, tak bude potreba koupit BB FlashBack. Pak jsem nasla program Wink, ktery existuje jak pod Win, tak pod Linux - coz je pro nas dulezite. Vyzkousela jsem a vzniklo demo_2. Podivejte se na ne, prosim. 
  
-Smysluplnost tutorialu ODSOUHLASENA. (Jeste vas prosim o nazor, jestli vidite takoveto tutorialy smysluplne, tedy smysluplne na to, abychom je dali na cd CAC 2.0. Ja si myslim, ze to smysl ma. )+Smysluplnost tutorialu ODSOUHLASENA.
  
 V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu
 +
 +
  
 ====== PRACE NA DATECH podrobne ====== ====== PRACE NA DATECH podrobne ======
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== Pro anotatory ===== ===== Pro anotatory =====
Line 226: Line 336:
       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})
 +      * [[http://ufal.mff.cuni.cz/~hladka/CAC20/poznamky_od_AB.pdf|Postrehy]] z kontroly dvojite anotace textu
 +        * Jan Štěpánek: [[:cak:poznamky|poznámky]]
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)
Line 265: Line 377:
             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').
    
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== Interni adresarova struktura ===== ===== Interni adresarova struktura =====
-   * 18.6. 8:30 schuzka o datech; výsledek schůzky:+   * 18.6. 8:30 schuzka o datech
       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.
-      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře: +      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře (aktualizováno po schůzce 24.9.2007)
-         * ''00_actual'' - aktuální data celého korpusu (Jiří Mírovský) +         * ''00_actual'' - aktuální .w a .m data celého korpusu (Jiří Mírovský) 
-         * &nbsp; &nbsp; odtud bude brát Kiril data a rozdělovat práci anotátorkám +         * &nbsp; &nbsp; odtud bude brát Kiril data a pouštět na ně parser 
-         * ''01_annotations''anotace souborů jednotlivými anotátorkami (Kiril Ribarov) +         * ''01_MST_Parsed''sem umístí Kiril vždy nově zparsovaný korpus (kdykoliv ho bude nově parsovat), do podadresáře pojmenovaného podle data (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně první sadu "100%" automatických kontrol+         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně automatické kontrolní skripty
          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)
 +         * &nbsp; &nbsp; odtud bude Bára brát data a rozdělovat práci anotátorkám
 +         * ''03_2annotations'' - anotace souborů jednotlivými anotátorkami (Kiril Ribarov)
          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné
-         * ''03_comparison'' - porovnání a slití souborů do jedné verze +         * ''04_comparison'' - porovnání a slití souborů do jedné verze (Kiril Ribarov) 
-         * &nbsp; &nbsp; takto slitá data dá Kiril paní Bémové ke kontrole +         * &nbsp; &nbsp; odtud si vezme data Jirka a znovu na ně spustí kontrolní skripty
-         * ''04_manual_check_1'' - ruční kontrola a oprava nesrovnalostí dvou anotací, případně výstupu skriptů (Kiril Ribarov) +
-         * &nbsp; &nbsp; na ručně prošlá data se pustí další, již méně spolehlivé skripty, které jen upozorňují na podezřelá místa; případně i stopro skripty+
          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)
-         * &nbsp; &nbsp; podezřelá místa pak znovu zkontroluje paní Bémová, když bude tak hodná +         * &nbsp; &nbsp; odtud vezme data Kiril a dá je paní Bémové ke kontrole 
-         * ''06_manual_check_2''ruční kontrola a oprava podezřelých místna která upozornily skripty (Kiril Ribarov) +         * ''06_manual_check''sem dá Kiril data potéco jsou zkontrolována paní Bémovou (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; Kiril navrhuje znovu pustit kontrolní skripty +         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; vezme si odtud data a znovu na ně spustí kontrolní skripty 
-         * ''07_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (Jiří Mírovský, Kiril Ribarov) +         * ''07_auto_check_C'' - třetí fáze automatických kontrol; analytická rovina se považuje už za správnou, Jirka ručně opraví morfologii (Jiří Mírovský) 
-          +         * &nbsp; &nbsp; odtud dá Jirka data do následujícího adresáře, je hotovo 
-   Polo-automaticka kontrola morfologickych anotaci 'sama proti sobe' +         * ''08_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová .w a .m data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (.w by se měnit nemělo) (Jiří Mírovský, Kiril Ribarov) 
-      * Jirka Mirovsky +         * ''_schemas'' aktuální PML-schémata potřebná k otevření souborů ve výše uvedených adresářích          
-      * na kontrolach m-souboru pracuje lokalne u sebe+
    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim
       * Jirka Mirovsky       * Jirka Mirovsky
Line 309: Line 435:
    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci
       * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.**        * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.** 
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +===== Soubory - prehled JIZ zpracovanych v danem kole ===== 
 +^ jmeno souboru    1. kolo (''03_2annotations''      2. kolo (''06_manual_check''         ^ 
 +| a01w    |   ab    ab     
 +| a02w    |   ab    ab     
 +| a03w    |   ab    ab     
 +| a04w    |   kk    zu    | 
 +| a05w    |   mz    ab    | 
 +| a06w    |   kg    ab     
 +| a07w    |   mz    ab    | 
 +| a08w    |   kk    zu     
 +| a09w    |   kg    ab     
 +| a10w    |   kk    zu     
 +| a11w    |   mz    ab    | 
 +| a12w    |   kg    ab     
 +| a13w    |   kk    zu     
 +| a14w    |   mz    ab    | 
 +| a15w    |   kg    ab     
 +| a16s    |    |        | 
 +| a17s    |    |       
 +| a18s    |    |      | 
 +| a19s    |      |        | 
 +| a20w    |   kg     zu     
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| n01w    |  ab    ab     
 +| n02w    |  ab    ab     
 +| n03w    |  ik    ab       
 +| n04w    |  ik    ab     
 +| n05w    |  ik    ab      | 
 +| n06w    |  ik    ab    | 
 +| n07w    |  ik    ab     
 +| n08w    |  ik    ab    | 
 +| n09w    |  ik    ab      | 
 +| n10w    |  ik    ab      | 
 +| n11w    |  ik    ab      | 
 +| n12w    |  ik    ab      | 
 +| n13w    |  ik    ab     
 +| n14w    |  ik    ab      | 
 +| n15w    |  ik    ab      | 
 +| n16w    |  ik    ab      | 
 +| n17w    |  ik    ab    | 
 +| n18w    |  ik    ab   
 +| n19w    |  ik    ab    | 
 +| n20w    |  ik    ab     
 +| n21w    |  ik    ab   
 +| n22w    |  ik    ab    | 
 +| n23w    |  ik    ab    | 
 +| n24w    |  ik    ab    | 
 +| n25w    |  ik    ab      | 
 +| n26w    |  ik    ab    | 
 +| n27w    |  ik    ab     
 +| n28w    |  ik    ab   
 +| n29w    |  ik    ab      | 
 +| n30w    |  ik    ab      | 
 +| n31w    |  ik    ab      | 
 +| n32w    |  ik    zu      | 
 +| n33w    |  ik    zu     
 +| n34w    |  ik  |   zu     
 +| n35w    |  ik  |   zu     
 +| n36w    |  ik  |   ab     
 +| n37w    |  ik  |   ab    | 
 +| n38w    |  ik  |   ab   
 +| n39w    |  ik  |   ab     
 +| n40w    |  ik  |   ab      | 
 +| n41w    |  ik  |   ab      | 
 +| n42w    |  ik  |   ab    | 
 +| n43w    |  ik  |   ab    | 
 +| n44w    |  kk  |   zu   
 +| n45w    |  kg  |   zu   
 +| n46w    |  mz  |   zu 
 +| n47w    |  kk  |   zu   
 +| n48w    |  kg  |   ab   
 +| n49w    |  mz  |   zu 
 +| n50w    |  mz  |   ab   
 +| n51w    |  mz  |   zu    | 
 +| n52w     kg  |   ab     
 +| n53s      |       
 +| n54s              | 
 +| n55s    |    |        | 
 +| n56s    |    |        | 
 +| n57s      |       
 +| n58s      |      | 
 +| n59s              | 
 +| n60s        |        | 
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| s00s    |               |
 +| s01w    |  ab    ab     
 +| s02w    |  ab    ab     
 +| s03w    |  kg,kk    ab       
 +| s04w    |  kg,kk    ab     
 +| s05w    |  kg,kk    ab      | 
 +| s06w    |  kg,kk    ab    | 
 +| s07w    |  kg,kk    ab     
 +| s08w    |  kg,kk    ab    | 
 +| s09w    |  kg,kk    ab      | 
 +| s10w    |  kg,kk    ab      | 
 +| s11w    |  ab    ab      | 
 +| s12w    |  ab    ab      | 
 +| s13w    |  ab    ab     
 +| s14w    |  ab    ab    | 
 +| s15w    |  ab    ab   
 +| s16w    |  ab    ab   
 +| s17w    |  sk    ab    | 
 +| s18w    |  sk    ab    | 
 +| s19w    |  sk    ab      | 
 +| s20w    |  sk    ab      | 
 +| s21w    |  sk    ab     
 +| s22w    |  sk    ab     
 +| s23w    |  sk    ab     
 +| s24w    |  sk    ab     
 +| s25w    |  sk    ab     
 +| s26w    |  sk    ab    | 
 +| s27w    |  sk    ab     
 +| s28w    |  sk    ab    | 
 +| s29w    |  sk    ab      | 
 +| s30w    |  sk    ab      | 
 +| s31w    |  kk,kg |   ab     
 +| s32w    |  kk,mz |   ab     
 +| s33w    |  kk,mz |   ab    | 
 +| s34w    |  kk,kg |   ab     
 +| s35w    |  kg,mz |   ab     
 +| s36w    |  kk,mz |   ab     
 +| s37w    |  kk,kg |   ab    | 
 +| s38w    |  kg,mz |   ab   
 +| s39w    |  kk,mz |   ab    | 
 +| s40w    |  kk,kg |   ab     
 +| s41w    |  kk    |   ab    | 
 +| s42w    |  kk    |   ab    | 
 +| s43w    |  kk    |   ab     
 +| s44w    |  kk    |   ab    | 
 +| s45w    |  kk    |   ab     
 +| s46w    |  mz    |  zu    | 
 +| s47w    |  mz    |  zu    | 
 +| s48w    |  mz    |  zu    | 
 +| s49w    |  mz    |  zu    | 
 +| s50w    |  mz    |  zu    | 
 +| s51w    |  kg  |    ab    | 
 +| s52w    |  kg     ab     
 +| s53w    |  kg  |    ab   
 +| s54w    |  kg     ab     
 +| s55w    |  kg     ab     
 +| s56w    |  kk     ab     
 +| s57w    |  kk     ab    | 
 +| s58w    |  kk     ab   
 +| s59w    |  kk     ab     
 +| s60w    |  kk     ab     
 +| s61w    |  mz     zu    | 
 +| s62w    |  mz     zu    | 
 +| s63w    |  mz     zu    | 
 +| s64w    |  mz     zu    | 
 +| s65w    |  mz     zu    | 
 +| s66w    |  mz     zu    | 
 +| s67w    |  mz     zu    | 
 +| s68w    |  mz     zu    | 
 +| s69s    |  mz     zu    | 
 +| s70s    |  mz     zu     
 +| s71s    |  kk     zu    | 
 +| s72s    |  kk     zu    | 
 +| s73s    |  kk     zu    | 
 +| s74s    |  kk          | 
 +| s75s    |  kk          | 
 +| s76s    |  kk     zu    | 
 +| s77s    |   kk |       
 +| s78s    |  kk  |      | 
 +| s79s     kk  |        | 
 +| s80s     kk          | 
 +| s81s    |  kg    |       
 +| s82s    |  mz    |       
 +| s83s    |  mz    |       
 +| s84s           
 +| s85s    |  kg  |        | 
 +| s86s    |  |      | 
 +| s87s             
 +| s88s      |      | 
 +| s89s    mz          | 
 +| s90s    |  |        | 
 +| s91s    |    |        | 
 +| s92s              | 
 +| s93s    mz  |       
 +| s94s    mz          | 
 +| s95s    |    |        | 
 +| s96s    |    |        | 
 +| s97s      |       
 +| s98s    kk  |      | 
 +| s99s    mz          | 
 +
 +
 +
  
 ====== KONTAKTY ====== ====== KONTAKTY ======
    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)
-   * Veronika Curdova (''myopie@seznam.cz'', cz, anotatorka) 
    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)
    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')
    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')
-   KK (sk, )+   Katarína Kandračová (sk, )
    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')
    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)
    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)
-   Lenka Zehrova (''z.lenicka@centrum.cz'', cz, anotatorka)+   MZ 
 + 
        

[ Back to the navigation ] [ Back to the content ]