[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:hladka:smerem-k-cak-2.0 [2007/09/23 22:01]
hladka
user:hladka:smerem-k-cak-2.0 [2008/12/12 12:21] (current)
hladka
Line 1: Line 1:
 ====== CAK 2.0 ====== ====== CAK 2.0 ======
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
  
  
Line 30: Line 11:
  
 ===== Aktuality ====== ===== Aktuality ======
-   * **24/9/07 v 9:00 schuzka k CAK 2.0. chodba ve 4. patre zapadniho kridla** - PROGRAM (Sepsala BH)+   * **28/04/2008** //Podivejte se prosim na anglickou verzi Pruvodce jak ve formatu html, tak i v pdf. Abych tak rekla ... nemusi to byt vylozene systematicky (napr. ze si vytisknete pdf a cele ho prectete), protoze kdyz se na text podiva nekdo, kdo ho cele noci needitoval, tak jeho prvni pohled padne na nejaky nedostatek:-( Komentare posilejte Honzovi Raabovi s Cc: hladka. Ucinte tak prosim nejpozdeji ve stredu 30. 4. - opravdu uz finisujeme, na zacatku kvetna odchazi CD-ROM do LDC.// 
 +      * anglicke [[http://ufal.mff.cuni.cz/morce/cac/index_en.php|html]] 
 +      * anglicke [[http://ufal.mff.cuni.cz/~hladka/CAC20/en_cac-guide.pdf|pdf]] 
 +   * **18/12/07** **REKAPITULACE roku 2007**, **aktulizace ke dni 7. 1. 2008** 
 +      * Pruvodce CAK 2.0 
 +         * ceska verze DOKONCENO 
 +         * anglicka verze PRACUJE SE NA NI 
 +      * CD-ROM 
 +         * data PRACUJE SE NA NICH 
 +         * nastroje 
 +            * zrevidovat soubory README 
 +            * Bonito - zavisi na datech 
 +            * LAW - DOKONCENO 
 +            * Netgraph - DOKONCENO (až na přiložená data ve formátu fs, která jsou zatím neúplná) 
 +            * TrEd - DOKONCENO 
 +            * tool_chain - LADI SE, otaznik u konverze pml w-soubor <-> csts 
 +               * do souboru README napsat verze nastroju, na jakych datech byly natrenovany, e-mailove odkazy 
 +               * tokenizace - dokumentace? 
 +               * morfologicka analyza - dokumentace? 
 +               * tagger 
 +               * parser 
 +         * bonusy 
 +            * STYX - DOKONCENO 
 +            * TrEdVoice - DOKONCENO    
 +         * tutorialy 
 +            * Bonito - DOKONCENO - jsou tam jeste nejake otazniky - viz vyse 
 +            * Netgraph - DOKONCENO 
 +            * TrEdVoice - DOKONCENO 
 +            * LAW - DOKONCENO 
 +            * TrEd - DOKONCENO 
 +            * STYX - DOKONCENO 
 +   * **23/11/07** 
 +      * Pruvodce CAK 2.0 ([[http://ufal.mff.cuni.cz/~hladka/CAC20/cac-guide.pdf|pdf]],                          [[http://ufal.mff.cuni.cz/morce/cac|html]]) 
 +         * Pruvodce je uz v takove fazi, ze je vhodne, abyste si ho precetli 
 +         * Prosim o korektury - korektury zaneste do vytisteneho Pruvodce. Byla bych moc rada, kdybyste je stihli do patku 30. listopadu t.r. (prijdu si pro ne:-))Nektere obrazky z pdf vypadly, podivejte se na ne v html (diky). 
 +      * Prosim o komentar k demosnimkum, ktere najdete v ''/net/projects/rest/CAC/cac20/tutorials'' (jeste chybi demosnimek k TrEd - Petr Pajas udela; STYX - chybi df. verze STYX, LAW) Komentare prosim piste primo sem na wiki. 
 +         * Nethraph 
 +            * JM: libi se;-) 
 +            * BH: moc rychly, komentare k dotazum; aktualizace JM: zpomalil jsem to o 10% a pridal komentar ke strukturnimu dotazu 
 +         * Bonito 
 +            * BH: moc velka obrazovka, doplnit uvod a zaver 
 +            * JM: libi se, u frekvencni distribuce obe sipky oznaceny VPRED 
 +         * TredVoice 
 +            * BH: libi se mi 
 +            * JM: libi se 
 +         * Styx 
 +         * TrEd   
 +      * Prosim o testovani skriptu ''tool_chain'' (''/net/projects/rest/CAC/cac20/tools/tool_chain''). Komentar posilejte primo Michalovi Kebrtovi (''michalek.k@seznam.cz''     
 +   * **24/9/07 v 9:00 schuzka k CAK 2.0. chodba ve 4. patre zapadniho kridla** - body pgmu, ktere jsme probrali, jsem presunula na patricna mista wiki dokumentace
       * CAK 1.0       * CAK 1.0
-         * //Jak se vam libi Pruvodce CAK 1.0?// +         * Rozesilani Pruvodce - Zatim jsem koupila 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene v [[http://ufal.mff.cuni.cz/~hladka/CAC20/stitky-korpusy.rtf|prilozenem souboru]] vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim.
-         * Rozesilani Pruvodce - //Koupila jsem 50 vytisku, z UFALovskeho adresare jsem vzala ty adresy, ktere u sebe maji alespon jeden z priznaku PDT0, PDT1, PCEDT, PADT a nekolik kousku jiz odeslo (cervene v [[http://ufal.mff.cuni.cz/~hladka/CAC20/stitky-korpusy.rtf|prilozenem souboru]] vybranych adres). Pokud chcete Pruvodce nekam poslat, tak adresu doplnte do souboru (pokud tam jeste neni), zacervenejte ji a dejte mi vedet. Realizaci odeslani zajistim. //+
       * Pruvodce CAK 2.0       * Pruvodce CAK 2.0
          * aktualni verze: [[http://ufal.mff.cuni.cz/morce/cac|html]]              * aktualni verze: [[http://ufal.mff.cuni.cz/morce/cac|html]]    
             * //Zatim neni nutne cist Pruvodce jako celek. Jeste udelame jedno kolo zmen/doplnku/..., //             * //Zatim neni nutne cist Pruvodce jako celek. Jeste udelame jedno kolo zmen/doplnku/..., //
             * //Podivejte se na barvy.//             * //Podivejte se na barvy.//
-         * Zatavene listy nebudou. +    * **19/7/07**
-         * Moje poznamky k jednotlivym obsahovym castem viz nize v casti 'Pruvodce' +
-      * CD-ROM CAK 2.0 +
-         * O datech (az na format) se v sirsim kruhu bavit nebudeme. //Po skonceni hlavni schuzky se sejdeme (Kiril, Jirka, Bara) nad daty.// +
-         * //V jakych formatech (CSTS, PML) CAK 2.0?// +
-         * //Bude samostatny tokenizer?// +
-         * //Bude 'nova' morfologicka analyza?// +
-         * // Tagger (MORCE), parser (MST). // +
-         * tool_chain. //S jakymi prepinaci? Prvotni navrh viz               [[http://ufal.mff.cuni.cz/morce/cac/?chapter=3#nastroje-zprac|tab. 3.9]]// +
-         * //Co z Netgraph na CD?// +
-         * Spusti-li se Bonito, automaticky se otevre CAK. //Neco podobneho s TrEd. // +
-         * Instalace. //Jake balicky? Kontrola [[http://ufal.mff.cuni.cz/morce/cac/?chapter=6|tabulky 6.1]]// +
-         * TrEdVoice. //Kam? Proberu s Leosem Prikrylem.// +
-      * //Podivejte se do KALENDARE, co nas ceka v zari a rijnu.// +
-      * //Tutorialy.// +
-   * **19/7/07**+
       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])       * Pruvodce CAK 1.0 vysel (viz [[http://cupress.cuni.cz/ink_ext/index.jsp?include=podrobnosti&id=2440&zalozka=1|zde]])
       * podepsana smlouva mezi UK MFF a LDC       * podepsana smlouva mezi UK MFF a LDC
Line 65: Line 78:
          * dohoda UK MFF <-> LDC PODEPSANA          * dohoda UK MFF <-> LDC PODEPSANA
          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi          * dohoda UK MFF <-> UJC AV je schvalena LDC, jeste dat k druhemu cteni Karlovi Olivovi
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
  
 ===== CD ROM ===== ===== CD ROM =====
 +Adresar ''/net/projects/REST/data/CAC/cac20'' je nasim 'ladicim' adresarem. //Az budete mit nastroje nachystane v nejake verzi (nemusi byt definitivni), tak je ulozte do spravneho adresare - abychom mohli zvolna zacit ladit.//
    * bonus-tracks/    * bonus-tracks/
       * STYX/       * STYX/
-      * TrEdVoice/+      * TrEdVoice/ ## //Kam presne prijde TrEdVoice? K TrEd? //
    * data/    * data/
-      * format: PML+      * format: PML, CSTS ## 
    * tools/    * tools/
       * Bonito/        * Bonito/ 
       * LAW/        * LAW/ 
-      * TrEd/  +      * TrEd/ ## // Filelist se seznamem 180 souboru CAK 2.0 /
-      * Netgraph/+      * Netgraph/ ## Klient i server.
       * tool_chain/       * tool_chain/
-         * tokenizer/ +         * tokenizer/ ##  
-         * morphology/+         * morphology/ ## // I SLED?//
          * tagger/          * tagger/
-         * parser/+         * parser/ ## //Mozne problemy - velikost natrenovaneho modulu, vypocetni a pametove naroky. (KR)//
          * tool_chain          * tool_chain
     * tutorials/     * tutorials/
- 
- 
- 
- 
- 
- 
- 
  
  
Line 105: Line 121:
             - Zdroje textu             - Zdroje textu
             - Roviny anotace             - Roviny anotace
-               * //Doplnit info o a-rovine. (BH) // 
             - Vyvoj projektu             - Vyvoj projektu
-               - CAK 1.0 //Doplnit. (BH)//+               - CAK 1.0
                - Na ceste k CAK 2.0                - Na ceste k CAK 2.0
                   * // Tabulka 2.2 - upravy (ktere BH, realizace JR)//                   * // Tabulka 2.2 - upravy (ktere BH, realizace JR)//
Line 119: Line 134:
                * //Ohlidat info o tokenizaci.//                * //Ohlidat info o tokenizaci.//
             - Data (**Jirka M., data.xml**)             - Data (**Jirka M., data.xml**)
-               - Format dat+               - Format dat 
                - Konvence pojmenovani souboru                - Konvence pojmenovani souboru
                - Velikost dat                - Velikost dat
Line 132: Line 147:
                   * //Doplnit (BH) //                   * //Doplnit (BH) //
                - Netgraph (**Jirka M., nastroje-netgraph.xml**)                - Netgraph (**Jirka M., nastroje-netgraph.xml**)
-                  * //Jaky je spravny spelling nazvu Netgraph?// +                  * Spravny spelling je **Netgraph**.
-                  // Dodat obrazky se stromy z CAK.// +
-                  // Nekde v uvodu odstavce doplnit jak se ma Netgraph k TrEd.//+
                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)                - Automaticke zpracovani textu (**BH, KR o parseru, nastroje-zprac.xml**)
-                  * // Doplnit odstavec o tokenizaci, pokud tam bude. // +                  * // Doplnit odstavec o tokenizaci, pokud tam bude.// 
-                  * // Aktualizovat procenta uspesnosti u taggeru. // +                  * // Aktualizovat procenta uspesnosti u taggeru.// 
-                  * // Specifikovat na jakych datech PZK 2.0 byl tagger trenovan. // +                  * // Specifikovat na jakych datech PZK 2.0 byl tagger trenovan.// 
-   * // Doplnit odstavec o parsingu (uspesnost, trenovaci data).// +                  * // Doplnit odstavec o parsingu (uspesnost, trenovaci data).// 
                   * // Popsat prepinace u tool_chain//                   * // Popsat prepinace u tool_chain//
             - Bonusovy material (**bonus.xml**)             - Bonusovy material (**bonus.xml**)
-               * //Doplnit ilustracni obrazek, neco vice k rozpoznavaci, doplnit citace.//+               * //Doplnit ilustracni obrazek, neco vice k rozpoznavaci, doplnit citace. (BH)//
             - Tutorialy (**BH, tutorialy.xml**)             - Tutorialy (**BH, tutorialy.xml**)
             - Instalace (**BH, instalace.xml**)             - Instalace (**BH, instalace.xml**)
-               * //Doplnit typy instalacnich balicku jejich popis.//+            - Distribuce licence (**BH, distribuce.xml**)
          - Osobnosti v projektu (**BH, osobnosti.xml**)          - Osobnosti v projektu (**BH, osobnosti.xml**)
          - Podekovani (**BH, podekovani.xml**)          - Podekovani (**BH, podekovani.xml**)
Line 235: Line 248:
  
    * technicky editor pruvodce    * technicky editor pruvodce
 +
 +
 +
 +
 +
 +
 +
  
  
Line 247: Line 267:
 ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-| ^            |//**24.4.** oslovit ty, kteri budou psat casti Pruvodce//|-|-|-|-|-|-|-|-|
 ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-| ^ Jirka H.    |-|-|do 20. cervna odevzdat 'naplneny' xml soubor|-|-|dodat df verzi LAW pro cd|dodat tutorial k LAW|-|-|
-^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|dodat df verzi morf. anal. pro cd|dodat tutorial k Bonito|-|-| +^ Jarka      |-|-|//do 20. cervna odevzdat 'naplnene' xml soubory//|-|-|//dodat df verzi morf. anal. pro cd//|//dodat tutorial k Bonito//|-|-| 
-^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|-|dodat tutorial k Netgraphy|-|-| +^ Jirka M.      |kontrola morf. anotaci|-|//do 20. cervna odevzdat 'naplnene' xml soubory; seznamit se s kontrolnimi PDT 2.0 skripty; **18.6. 8:30 schuzka o datech**//|-|-|//dodat df. verzi Netgraph//|//dodat tutorial k Netgraph//|-|-| 
-^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|dodat df verzi parseru pro cd|-|-|-| +^ Kiril      |prubezne priprava dat pro anotatory|//vymyslet strategii pro porovnani souboru od anotatoru//|//makra do TrEd;// **18.6. 8:30 schuzka o datech**|-|-|//dodat df verzi parseru pro cd//|-|-|-| 
-^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|1. verze Pruvodce|-|dodat df verzi taggeru pro cd|-|-|-|+^ Honza R.     |//do **23.4.** pripravit xml soubory pro jednotlive casti Pruvodce//|-|-|//1. verze Pruvodce//|-|//dodat df verzi taggeru pro cd//|-|-|-|
 ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-| ^ Pavel Q.     |-|-|-|-|-|dodat morfologii pro Bonito|-|-|-|
 ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-| ^ Ondra B.      |-|-|-|-|-|-|-|1. verze instalatoru|-|
-^ Michal K.     |-|-|-|-|-|-|tool_chain|-|-| +^ Michal K.     |-|-|-|-|-|-|//tool_chain//|-|-| 
-^ Michal S.     |-|-|-|-|-|dodat designove podklady|-|-|-|+^ Michal S.     |-|-|-|-|-|//dodat designove podklady//|-|-|-|
 ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-| ^ Ondrej K.     |-|-|-|-|-|dodat df verzi STYX pro cd|dodat tutorial k STYX|-|-|
 +^ Leos Prikryl     |-|-|-|-|-|-|//dodat df. verzi TrEdVoice (ve spolupraci s Plzni)//|//dodat tutorial k TrEdVoice//|
  
 ====== POKYNY ====== ====== POKYNY ======
Line 277: Line 298:
  
 Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW Viz napr. /net/projects/REST/data/CAC/cac10/tools/LAW
 +
  
  
Line 295: Line 317:
  
 V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu V Pruvodci CAC 2.0 bude rovnez odkaz na [[http://ufallab.ms.mff.cuni.cz/video/categoryshow/index/2|PDT tutorial]] z lonskeho listopadu
 +
 +
  
 ====== PRACE NA DATECH podrobne ====== ====== PRACE NA DATECH podrobne ======
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
 ===== Pro anotatory ===== ===== Pro anotatory =====
Line 302: Line 336:
       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)       * **[[http://ufal.mff.cuni.cz/~hladka/CAC20/AnalAnnotCAC_07.pdf|Pokyny pro anotaci (23/6/2007)]]** (CTI ME - shrnuti vsech podstatnych informaci)
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/pdt-vallex-3col.zip|Valencni slovnik]] z PDT (a k němu {{user:hladka:pouzitipdtvallexu.pdf|manuál k používání pro analytickou anotaci}})
 +      * [[http://ufal.mff.cuni.cz/~hladka/CAC20/poznamky_od_AB.pdf|Postrehy]] z kontroly dvojite anotace textu
 +        * Jan Štěpánek: [[:cak:poznamky|poznámky]]
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/makra_CAK.pdf|Prehled maker]] kontextu PML_CAC_A_Edit editoru TrEd
       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)       * [[http://ufal.mff.cuni.cz/~hladka/CAC20/Breakfast_CAC.pdf|Slajdy]] ze snidane 18/6/2007(trochu vice povidani o s. anotaci CAK)
Line 341: Line 377:
             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').             * V okne ''"Select resources to save"'' klikněte na první řádek (mělo by v něm být jméno už rovněž modifikované, s ''_JP.m'' na konci). Hned poté odsouhlaste uložení pomocí tlačítka ''"OK"'' (tedy není nutno znovu měnit jméno souboru pomocí ''Change Filename'').
    
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
  
  
Line 346: Line 394:
  
 ===== Interni adresarova struktura ===== ===== Interni adresarova struktura =====
-   * 20.9. zde jsou moje (BH) body do pgmu +   * 18.6. 8:30 schuzka o datech
-      * revize adresarove struktury a jejiho popisu uvedeneho nize +
-      * dalsi kontrola m-souboru --> kontaktovat Johanku +
-      * soubory **PRO** anotatory predavam ja; **ODKUD?** Doposud jsem je brala z ''01_MST_Parsed'' +
-      * soubory **OD** anotatoru prijimam ja (pro prehled). E-maily se soubory presilam Kirilovi. +
-      * protoze je nedostatek anotatoru, anotatorka ''ik'' anotuje sama. Pokud sezenu jeste nekoho dalsiho, tak taky bude anotovat  sam. +
-      * prehledova tabulka zpracovani souboru +
-   * 18.6. 8:30 schuzka o datech; výsledek schůzky:+
       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.       * Vytvoření adresářové struktury v ''/net/projects/REST/data/CAC/work_CAC20/data'' s dále uvedenými podadresáři.
-      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře: +      * Data budou uložena a zpracována takto, v závorce jsou lidé zodpovědní za obsah adresáře (aktualizováno po schůzce 24.9.2007)
-         * ''00_actual'' - aktuální data celého korpusu (Jiří Mírovský) +         * ''00_actual'' - aktuální .w a .m data celého korpusu (Jiří Mírovský) 
-         * &nbsp; &nbsp; odtud bude brát Kiril data a rozdělovat práci anotátorkám +         * &nbsp; &nbsp; odtud bude brát Kiril data a pouštět na ně parser 
-         * ''01_annotations''anotace souborů jednotlivými anotátorkami (Kiril Ribarov) +         * ''01_MST_Parsed''sem umístí Kiril vždy nově zparsovaný korpus (kdykoliv ho bude nově parsovat), do podadresáře pojmenovaného podle data (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně první sadu "100%" automatických kontrol+         * &nbsp; &nbsp; odtud si bude Jirka brát data a pustí na ně automatické kontrolní skripty
          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)          * ''02_auto_check_A'' - první fáze automatických kontrol (Jiří Mírovský)
 +         * &nbsp; &nbsp; odtud bude Bára brát data a rozdělovat práci anotátorkám
 +         * ''03_2annotations'' - anotace souborů jednotlivými anotátorkami (Kiril Ribarov)
          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné          * &nbsp; &nbsp; data odtud si vezme Kiril a provede porovnání a slití dvou verzí do jedné
-         * ''03_comparison'' - porovnání a slití souborů do jedné verze +         * ''04_comparison'' - porovnání a slití souborů do jedné verze (Kiril Ribarov) 
-         * &nbsp; &nbsp; takto slitá data dá Kiril paní Bémové ke kontrole +         * &nbsp; &nbsp; odtud si vezme data Jirka a znovu na ně spustí kontrolní skripty
-         * ''04_manual_check_1'' - ruční kontrola a oprava nesrovnalostí dvou anotací, případně výstupu skriptů (Kiril Ribarov) +
-         * &nbsp; &nbsp; na ručně prošlá data se pustí další, již méně spolehlivé skripty, které jen upozorňují na podezřelá místa; případně i stopro skripty+
          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)          * ''05_auto_check_B'' - druhá fáze automatických kontrol (Jiří Mírovský)
-         * &nbsp; &nbsp; podezřelá místa pak znovu zkontroluje paní Bémová, když bude tak hodná +         * &nbsp; &nbsp; odtud vezme data Kiril a dá je paní Bémové ke kontrole 
-         * ''06_manual_check_2''ruční kontrola a oprava podezřelých místna která upozornily skripty (Kiril Ribarov) +         * ''06_manual_check''sem dá Kiril data potéco jsou zkontrolována paní Bémovou (Kiril Ribarov) 
-         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; Kiril navrhuje znovu pustit kontrolní skripty +         * &nbsp; &nbsp; odtud již vychází hotová analytická rovina; morfologická rovina a slovní měly zůstat beze změny, kromě atributu guessed_form na morfologické rovině, kam anotátorky mohly něco doplnit; kontrolu, že se nic nezměnilo, a slití guessed_form do aktuálního morfologického souboru provede Jirka; vezme si odtud data a znovu na ně spustí kontrolní skripty 
-         * ''07_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (Jiří Mírovský, Kiril Ribarov) +         * ''07_auto_check_C'' - třetí fáze automatických kontrol; analytická rovina se považuje už za správnou, Jirka ručně opraví morfologii (Jiří Mírovský) 
-          +         * &nbsp; &nbsp; odtud dá Jirka data do následujícího adresáře, je hotovo 
-   Polo-automaticka kontrola morfologickych anotaci 'sama proti sobe' +         * ''08_finished'' - tady budou hotová data, tedy ta část korpusu, která je již hotová; hotová .w a .m data se budou kopírovat rovněž do adresáře ''00_actual'', aby se odtud v případě potřeby mohla brát (.w by se měnit nemělo) (Jiří Mírovský, Kiril Ribarov) 
-      * Jirka Mirovsky +         * ''_schemas'' aktuální PML-schémata potřebná k otevření souborů ve výše uvedených adresářích          
-      * na kontrolach m-souboru pracuje lokalne u sebe+
    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim    * Polo-automaticka kontrola morfologickych anotaci vzhledem k syntaktickym anotacim
       * Jirka Mirovsky       * Jirka Mirovsky
Line 395: Line 435:
    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci    * Skripty (z PDT 2.0) pro kontrolu syntaktickych anotaci
       * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.**        * **Jirko, mohl by ses prosim seznamit se skripty navrzenymi pro kontrolu syntaktickych anotaci PDT 2.0. Je potreba to udelat co nejdrive (samozrejme az budou nejake soubory v ''net/projects/rest/data/CAC/atrees/MST2/odAlly''), protoze pokud by se zjistilo, ze je nutno neco doimplementovat, tak aby na to byl cas.  Dulezite poznamky uvadej zde.** 
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +
 +===== Soubory - prehled JIZ zpracovanych v danem kole ===== 
 +^ jmeno souboru    1. kolo (''03_2annotations''      2. kolo (''06_manual_check''         ^ 
 +| a01w    |   ab    ab     
 +| a02w    |   ab    ab     
 +| a03w    |   ab    ab     
 +| a04w    |   kk    zu    | 
 +| a05w    |   mz    ab    | 
 +| a06w    |   kg    ab     
 +| a07w    |   mz    ab    | 
 +| a08w    |   kk    zu     
 +| a09w    |   kg    ab     
 +| a10w    |   kk    zu     
 +| a11w    |   mz    ab    | 
 +| a12w    |   kg    ab     
 +| a13w    |   kk    zu     
 +| a14w    |   mz    ab    | 
 +| a15w    |   kg    ab     
 +| a16s    |    |        | 
 +| a17s    |    |       
 +| a18s    |    |      | 
 +| a19s    |      |        | 
 +| a20w    |   kg     zu     
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| n01w    |  ab    ab     
 +| n02w    |  ab    ab     
 +| n03w    |  ik    ab       
 +| n04w    |  ik    ab     
 +| n05w    |  ik    ab      | 
 +| n06w    |  ik    ab    | 
 +| n07w    |  ik    ab     
 +| n08w    |  ik    ab    | 
 +| n09w    |  ik    ab      | 
 +| n10w    |  ik    ab      | 
 +| n11w    |  ik    ab      | 
 +| n12w    |  ik    ab      | 
 +| n13w    |  ik    ab     
 +| n14w    |  ik    ab      | 
 +| n15w    |  ik    ab      | 
 +| n16w    |  ik    ab      | 
 +| n17w    |  ik    ab    | 
 +| n18w    |  ik    ab   
 +| n19w    |  ik    ab    | 
 +| n20w    |  ik    ab     
 +| n21w    |  ik    ab   
 +| n22w    |  ik    ab    | 
 +| n23w    |  ik    ab    | 
 +| n24w    |  ik    ab    | 
 +| n25w    |  ik    ab      | 
 +| n26w    |  ik    ab    | 
 +| n27w    |  ik    ab     
 +| n28w    |  ik    ab   
 +| n29w    |  ik    ab      | 
 +| n30w    |  ik    ab      | 
 +| n31w    |  ik    ab      | 
 +| n32w    |  ik    zu      | 
 +| n33w    |  ik    zu     
 +| n34w    |  ik  |   zu     
 +| n35w    |  ik  |   zu     
 +| n36w    |  ik  |   ab     
 +| n37w    |  ik  |   ab    | 
 +| n38w    |  ik  |   ab   
 +| n39w    |  ik  |   ab     
 +| n40w    |  ik  |   ab      | 
 +| n41w    |  ik  |   ab      | 
 +| n42w    |  ik  |   ab    | 
 +| n43w    |  ik  |   ab    | 
 +| n44w    |  kk  |   zu   
 +| n45w    |  kg  |   zu   
 +| n46w    |  mz  |   zu 
 +| n47w    |  kk  |   zu   
 +| n48w    |  kg  |   ab   
 +| n49w    |  mz  |   zu 
 +| n50w    |  mz  |   ab   
 +| n51w    |  mz  |   zu    | 
 +| n52w     kg  |   ab     
 +| n53s      |       
 +| n54s              | 
 +| n55s    |    |        | 
 +| n56s    |    |        | 
 +| n57s      |       
 +| n58s      |      | 
 +| n59s              | 
 +| n60s        |        | 
 +
 +^ jmeno souboru    1. kolo (''03_2annotations''     ^   2. kolo (''06_manual_check''         ^ 
 +| s00s    |               |
 +| s01w    |  ab    ab     
 +| s02w    |  ab    ab     
 +| s03w    |  kg,kk    ab       
 +| s04w    |  kg,kk    ab     
 +| s05w    |  kg,kk    ab      | 
 +| s06w    |  kg,kk    ab    | 
 +| s07w    |  kg,kk    ab     
 +| s08w    |  kg,kk    ab    | 
 +| s09w    |  kg,kk    ab      | 
 +| s10w    |  kg,kk    ab      | 
 +| s11w    |  ab    ab      | 
 +| s12w    |  ab    ab      | 
 +| s13w    |  ab    ab     
 +| s14w    |  ab    ab    | 
 +| s15w    |  ab    ab   
 +| s16w    |  ab    ab   
 +| s17w    |  sk    ab    | 
 +| s18w    |  sk    ab    | 
 +| s19w    |  sk    ab      | 
 +| s20w    |  sk    ab      | 
 +| s21w    |  sk    ab     
 +| s22w    |  sk    ab     
 +| s23w    |  sk    ab     
 +| s24w    |  sk    ab     
 +| s25w    |  sk    ab     
 +| s26w    |  sk    ab    | 
 +| s27w    |  sk    ab     
 +| s28w    |  sk    ab    | 
 +| s29w    |  sk    ab      | 
 +| s30w    |  sk    ab      | 
 +| s31w    |  kk,kg |   ab     
 +| s32w    |  kk,mz |   ab     
 +| s33w    |  kk,mz |   ab    | 
 +| s34w    |  kk,kg |   ab     
 +| s35w    |  kg,mz |   ab     
 +| s36w    |  kk,mz |   ab     
 +| s37w    |  kk,kg |   ab    | 
 +| s38w    |  kg,mz |   ab   
 +| s39w    |  kk,mz |   ab    | 
 +| s40w    |  kk,kg |   ab     
 +| s41w    |  kk    |   ab    | 
 +| s42w    |  kk    |   ab    | 
 +| s43w    |  kk    |   ab     
 +| s44w    |  kk    |   ab    | 
 +| s45w    |  kk    |   ab     
 +| s46w    |  mz    |  zu    | 
 +| s47w    |  mz    |  zu    | 
 +| s48w    |  mz    |  zu    | 
 +| s49w    |  mz    |  zu    | 
 +| s50w    |  mz    |  zu    | 
 +| s51w    |  kg  |    ab    | 
 +| s52w    |  kg     ab     
 +| s53w    |  kg  |    ab   
 +| s54w    |  kg     ab     
 +| s55w    |  kg     ab     
 +| s56w    |  kk     ab     
 +| s57w    |  kk     ab    | 
 +| s58w    |  kk     ab   
 +| s59w    |  kk     ab     
 +| s60w    |  kk     ab     
 +| s61w    |  mz     zu    | 
 +| s62w    |  mz     zu    | 
 +| s63w    |  mz     zu    | 
 +| s64w    |  mz     zu    | 
 +| s65w    |  mz     zu    | 
 +| s66w    |  mz     zu    | 
 +| s67w    |  mz     zu    | 
 +| s68w    |  mz     zu    | 
 +| s69s    |  mz     zu    | 
 +| s70s    |  mz     zu     
 +| s71s    |  kk     zu    | 
 +| s72s    |  kk     zu    | 
 +| s73s    |  kk     zu    | 
 +| s74s    |  kk          | 
 +| s75s    |  kk          | 
 +| s76s    |  kk     zu    | 
 +| s77s    |   kk |       
 +| s78s    |  kk  |      | 
 +| s79s     kk  |        | 
 +| s80s     kk          | 
 +| s81s    |  kg    |       
 +| s82s    |  mz    |       
 +| s83s    |  mz    |       
 +| s84s           
 +| s85s    |  kg  |        | 
 +| s86s    |  |      | 
 +| s87s             
 +| s88s      |      | 
 +| s89s    mz          | 
 +| s90s    |  |        | 
 +| s91s    |    |        | 
 +| s92s              | 
 +| s93s    mz  |       
 +| s94s    mz          | 
 +| s95s    |    |        | 
 +| s96s    |    |        | 
 +| s97s      |       
 +| s98s    kk  |      | 
 +| s99s    mz          | 
 +
 +
 +
  
 ====== KONTAKTY ====== ====== KONTAKTY ======
    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)    * Alla Bemova (''bemova@ufal.mff.cuni.cz'', kontrola anotaci)
-   * Veronika Curdova (''myopie@seznam.cz'', cz, anotatorka) 
    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)    * Katarina Gajdosova (''katarinag@korpus.juls.savba.sk'', sk, anotatorka)
    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')    * Jan Hajic (''hajic@ufal.mff.cuni.cz'')
    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')    * Barbora Hladka (''hladka@ufal.mff.cuni.cz'')
-   KK (sk, )+   Katarína Kandračová (sk, )
    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')    * Jirka Mirovsky (''mirovsky@ufal.mff.cuni.cz'')
    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)    * Kiril Ribarov (''ribarov@ufal.mff.cuni.cz'', TrEd)
    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)    * Zdenka Uresova (''uresova@ufal.mff.cuni.cz'', kontrola anotaci)
-   Lenka Zehrova (''z.lenicka@centrum.cz'', cz, anotatorka)+   MZ 
 + 
        

[ Back to the navigation ] [ Back to the content ]