[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
polo-automaticke-kontroly-dat [2011/11/14 11:07]
ufal
polo-automaticke-kontroly-dat [2011/12/13 11:49] (current)
ufal
Line 3: Line 3:
 ==== chystané: ==== ==== chystané: ====
  - (HOTOVO) vytvořit tabulku distribuce typů - zkontrolovat,​ zda je všude typ (informal-type) a zda někde není starý typ; ta místa projít ručně  - (HOTOVO) vytvořit tabulku distribuce typů - zkontrolovat,​ zda je všude typ (informal-type) a zda někde není starý typ; ta místa projít ručně
- - zkontrolovat,​ zda je všude nastaven atribut src a target-node.rf + ​- ​(HOTOVO) ​zkontrolovat,​ zda je všude nastaven atribut src a target-node.rf 
- - zkontrolovat,​ že šipky vedou v řetězci; případně převěsit (skript pro bridging už existuje, podobný pro text-coref)+ ​- ​(HOTOVO) ​zkontrolovat,​ že šipky vedou v řetězci; případně převěsit (skript pro bridging už existuje, podobný ​už i pro text-coref; akorát ještě vyřešit, když do jednoho uzlu vedou dvě gramatické koref. - ty se nepřevěšují a narušují správnou funkci skriptu)
 - zkontrolovat,​ ze sipky nevedou od uzlu s t-lemmatem #Gen a #Unsp a na uzly s funktorem INTF (pozor, obcas jsou poznamky od JP a RO o chybnem lemmatu) - zkontrolovat,​ ze sipky nevedou od uzlu s t-lemmatem #Gen a #Unsp a na uzly s funktorem INTF (pozor, obcas jsou poznamky od JP a RO o chybnem lemmatu)
-- u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat ​+(HOTOVO) ​u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat ​
  
  
Line 77: Line 77:
   >> give $anaf.id''​   >> give $anaf.id''​
  
-==== distribuce ​src + kontrola prázdného src a target-node.rf ====+==== Distribuce ​src + kontrola prázdného src a target-node.rf ====
  
 V PML-TQ pomocí dotazu (obdobně pro coref_text):​ V PML-TQ pomocí dotazu (obdobně pro coref_text):​
Line 88: Line 88:
  
 ^ src ^ četnost ^ ^ src ^ četnost ^
-| (prázdné) | 7 | 
 | JP | 18346 | | JP | 18346 |
 | RO | 12782 | | RO | 12782 |
Line 95: Line 94:
 | RO+JP | 863 | | RO+JP | 863 |
 | JP+RO | 341 | | JP+RO | 341 |
 +| **(prázdný)** | 7 |
  
 **Výsledek pro coref_text (14.11.2011):​** **Výsledek pro coref_text (14.11.2011):​**
Line 106: Line 106:
 | RO+JP | 3492 | | RO+JP | 3492 |
 | JP+RO | 1406 | | JP+RO | 1406 |
-| (prázdný) | 35 |+**(prázdný)** | 35 |
  
 +Identifikátory anaforů, odkud vedou šipky s prázdným src, se najdou takto (obdobně coref_text):​
  
 +''​t-node $anaf := 
 +[ member bridging $n := 
 +     [ !src ~ "​.+"​ ] ];
 +  >> give $anaf.id''​
 +
 +Identifikátory anaforů, odkud vedou šipky s prázdným target-node.rf,​ se najdou takto (obdobně coref_text):  ​
 +(14.11.2011 jich bylo 0 a 0.)
 +
 +''​t-node $anaf := 
 +[ member bridging ​
 +     [ 0x target-node.rf t-node [  ] ] ];
 +  >> give $anaf.id''​
 +
 +==== Hledání dvou (a více) paralelních bridging šipek ====
 +
 +V PMLTQ dotazem:
 +
 +''​t-node $n := 
 +[ member bridging ​
 +     [ target-node.rf $n4 ], 
 +     ​member bridging ​
 +     [ target-node.rf t-node $n4 := [  ] ] ];
 +  >> give distinct $n.id''​
 +
 +13. prosince se našlo 28 výskytů, ručně jsem vyřešil.

[ Back to the navigation ] [ Back to the content ]