[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
polo-automaticke-kontroly-dat [2011/11/14 10:36]
ufal
polo-automaticke-kontroly-dat [2011/12/13 11:49] (current)
ufal
Line 2: Line 2:
  
 ==== chystané: ==== ==== chystané: ====
- - vytvořit tabulku distribuce typů - zkontrolovat, zda je všude typ (informal-type) a zda někde není starý typ; ta místa projít ručně + (HOTOVO) vytvořit tabulku distribuce typů - zkontrolovat, zda je všude typ (informal-type) a zda někde není starý typ; ta místa projít ručně 
- - zkontrolovat, zda je všude nastaven atribut src a target-node.rf + (HOTOVO) zkontrolovat, zda je všude nastaven atribut src a target-node.rf 
- - zkontrolovat, že šipky vedou v řetězci; případně převěsit (skript pro bridging už existuje, podobný pro text-coref)+ (HOTOVO) zkontrolovat, že šipky vedou v řetězci; případně převěsit (skript pro bridging už existuje, podobný už i pro text-coref; akorát ještě vyřešit, když do jednoho uzlu vedou dvě gramatické koref. - ty se nepřevěšují a narušují správnou funkci skriptu)
 - zkontrolovat, ze sipky nevedou od uzlu s t-lemmatem #Gen a #Unsp a na uzly s funktorem INTF (pozor, obcas jsou poznamky od JP a RO o chybnem lemmatu) - zkontrolovat, ze sipky nevedou od uzlu s t-lemmatem #Gen a #Unsp a na uzly s funktorem INTF (pozor, obcas jsou poznamky od JP a RO o chybnem lemmatu)
-- u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat +(HOTOVO) u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat 
  
  
Line 39: Line 39:
  
  
-===== hotové: =====+===== HOTOVÉ =====
  
-==== tabulka distribuce typů + kontrola prázdného typu ====+==== Distribuce typů + kontrola prázdného typu ====
  
 V PML-TQ pomocí dotazu (obdobně pro coref_text): V PML-TQ pomocí dotazu (obdobně pro coref_text):
Line 51: Line 51:
 **Výsledek pro bridging (14.11.2011):** **Výsledek pro bridging (14.11.2011):**
  
-''SET_SUB    13010 +^ typ ^ četnost ^ 
-SUB_SET    6009 +SET_SUB 13010 | 
-WHOLE_PART    4502 +| SUB_SUB | 6009 | 
-CONTRAST    2305 +WHOLE_PART 4502 | 
-REST       2246 +CONTRAST 2305 | 
-PART_WHOLE    2054 +REST 2246 | 
-P_FUNCT      1832 +PART_WHOLE 2054 | 
-ANAF         840 +P_FUNCT 1832 | 
-FUNCT_P       429 +ANAF 840 | 
-(prázdný)      28''+FUNCT_P 429 | 
 +| **(prázdný)** | 28 |
  
 **Výsledek pro coref_text (14.11.2011):** **Výsledek pro coref_text (14.11.2011):**
  
-''SPEC 70936 +^ typ ^ četnost ^ 
-GEN 16264 +SPEC 70936 | 
-(prázdný) 5''+GEN 16264  
 +| **(prázdný)** | |
  
 +Identifikátory anaforů, odkud vedou šipky s prázdným typem, se najdou takto (obdobně coref_text):
  
 +''t-node $anaf := 
 +[ member bridging $n := 
 +     [ !informal-type ~ ".+" ] ];
 +  >> give $anaf.id''
 +
 +==== Distribuce src + kontrola prázdného src a target-node.rf ====
 +
 +V PML-TQ pomocí dotazu (obdobně pro coref_text):
 +
 +''t-node 
 +[ member bridging $n := [  ] ];
 +  >> for $n.src give $1,count()''
 +
 +**Výsledek pro bridging (14.11.2011):**
 +
 +^ src ^ četnost ^
 +| JP | 18346 |
 +| RO | 12782 |
 +| JK | 606 |
 +| AN | 310 |
 +| RO+JP | 863 |
 +| JP+RO | 341 |
 +| **(prázdný)** | 7 |
 +
 +**Výsledek pro coref_text (14.11.2011):**
 +
 +^ src ^ četnost ^
 +| PDT_2.0 | 20523 |
 +| JP | 31791 |
 +| RO | 27694 |
 +| JK | 1581 |
 +| AN | 683 |
 +| RO+JP | 3492 |
 +| JP+RO | 1406 |
 +| **(prázdný)** | 35 |
 +
 +Identifikátory anaforů, odkud vedou šipky s prázdným src, se najdou takto (obdobně coref_text):
 +
 +''t-node $anaf := 
 +[ member bridging $n := 
 +     [ !src ~ ".+" ] ];
 +  >> give $anaf.id''
 +
 +Identifikátory anaforů, odkud vedou šipky s prázdným target-node.rf, se najdou takto (obdobně coref_text):  
 +(14.11.2011 jich bylo 0 a 0.)
 +
 +''t-node $anaf := 
 +[ member bridging 
 +     [ 0x target-node.rf t-node [  ] ] ];
 +  >> give $anaf.id''
 +
 +==== Hledání dvou (a více) paralelních bridging šipek ====
 +
 +V PMLTQ dotazem:
 +
 +''t-node $n := 
 +[ member bridging 
 +     [ target-node.rf $n4 ], 
 +     member bridging 
 +     [ target-node.rf t-node $n4 := [  ] ] ];
 +  >> give distinct $n.id''
 +
 +13. prosince se našlo 28 výskytů, ručně jsem vyřešil.

[ Back to the navigation ] [ Back to the content ]