Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
polo-automaticke-kontroly-dat [2011/11/14 10:32] ufal |
polo-automaticke-kontroly-dat [2011/11/14 11:18] ufal |
||
---|---|---|---|
Line 2: | Line 2: | ||
==== chystané: ==== | ==== chystané: ==== | ||
- | - vytvořit tabulku distribuce typů - zkontrolovat, | + | |
- | - zkontrolovat, | + | |
- | - zkontrolovat, | + | - zkontrolovat, |
- zkontrolovat, | - zkontrolovat, | ||
- u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat | - u dlouhych koreferencnich retezcu propojenych bridgingem nechat jednu bridging sipku, ktera je propojuje. Ostatni smazat | ||
Line 39: | Line 39: | ||
- | ==== hotové: | + | ===== HOTOVÉ ===== |
- | === tabulka distribuce | + | ==== Distribuce |
V PML-TQ pomocí dotazu (obdobně pro coref_text): | V PML-TQ pomocí dotazu (obdobně pro coref_text): | ||
Line 51: | Line 51: | ||
**Výsledek pro bridging (14.11.2011): | **Výsledek pro bridging (14.11.2011): | ||
- | SET_SUB 13010 | + | ^ typ ^ četnost ^ |
- | SUB_SET 6009 | + | | SET_SUB |
- | WHOLE_PART 4502 | + | | SUB_SUB | 6009 | |
- | CONTRAST 2305 | + | | WHOLE_PART |
- | REST 2246 | + | | CONTRAST |
- | PART_WHOLE 2054 | + | | REST | 2246 | |
- | P_FUNCT 1832 | + | | PART_WHOLE |
- | ANAF 840 | + | | P_FUNCT |
- | FUNCT_P 429 | + | | ANAF | 840 | |
- | (prázdný) 28 | + | | FUNCT_P |
+ | | **(prázdný)** | 28 | | ||
+ | |||
+ | **Výsledek pro coref_text (14.11.2011): | ||
+ | |||
+ | ^ typ ^ četnost ^ | ||
+ | | SPEC | 70936 | | ||
+ | | GEN | 16264 | | ||
+ | | **(prázdný)** | 5 | | ||
+ | |||
+ | Identifikátory anaforů, odkud vedou šipky s prázdným typem, se najdou takto (obdobně coref_text): | ||
+ | |||
+ | '' | ||
+ | [ member bridging $n := | ||
+ | [ !informal-type ~ " | ||
+ | >> give $anaf.id'' | ||
+ | |||
+ | ==== Distribuce src + kontrola prázdného src a target-node.rf ==== | ||
+ | |||
+ | V PML-TQ pomocí dotazu (obdobně pro coref_text): | ||
+ | |||
+ | '' | ||
+ | [ member bridging $n := [ ] ]; | ||
+ | >> for $n.src give $1, | ||
+ | |||
+ | **Výsledek pro bridging (14.11.2011): | ||
+ | |||
+ | ^ src ^ četnost ^ | ||
+ | | JP | 18346 | | ||
+ | | RO | 12782 | | ||
+ | | JK | 606 | | ||
+ | | AN | 310 | | ||
+ | | RO+JP | 863 | | ||
+ | | JP+RO | 341 | | ||
+ | | **(prázdný)** | 7 | | ||
+ | |||
+ | **Výsledek pro coref_text (14.11.2011): | ||
+ | |||
+ | ^ src ^ četnost ^ | ||
+ | | PDT_2.0 | 20523 | | ||
+ | | JP | 31791 | | ||
+ | | RO | 27694 | | ||
+ | | JK | 1581 | | ||
+ | | AN | 683 | | ||
+ | | RO+JP | 3492 | | ||
+ | | JP+RO | 1406 | | ||
+ | | **(prázdný)** | 35 | | ||
+ | |||
+ | Identifikátory anaforů, odkud vedou šipky s prázdným src, se najdou takto (obdobně coref_text): | ||
+ | |||
+ | '' | ||
+ | [ member bridging $n := | ||
+ | [ !src ~ " | ||
+ | >> give $anaf.id'' | ||
+ | |||
+ | Identifikátory anaforů, odkud vedou šipky s prázdným target-node.rf, | ||
+ | (14.11.2011 jich bylo 0 a 0.) | ||
+ | |||
+ | '' | ||
+ | [ member bridging | ||
+ | [ 0x target-node.rf t-node [ ] ] ]; | ||
+ | >> give $anaf.id'' | ||