Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:dz-parser:conll [2008/04/29 10:12] zeman Výsledky němčiny a portugalštiny. |
user:zeman:dz-parser:conll [2009/03/02 11:38] zeman Výsledky CoNLL 2009 (zatím bez úprav značek). |
||
---|---|---|---|
Line 28: | Line 28: | ||
$PARSER/ | $PARSER/ | ||
($PARSER/ | ($PARSER/ | ||
- | |||
- | |||
===== Zpracování na clusteru ===== | ===== Zpracování na clusteru ===== | ||
Line 37: | Line 35: | ||
* '' | * '' | ||
* '' | * '' | ||
- | * '' | + | * '' |
* '' | * '' | ||
* '' | * '' | ||
===== Výsledky ===== | ===== Výsledky ===== | ||
+ | |||
==== Výchozí nastavení ==== | ==== Výchozí nastavení ==== | ||
Následující tabulka ukazuje úspěšnost DZ parseru s výchozím nastavením na průběžných testovacích datech CoNLL, s původními neupravenými značkami CoNLL (tabulátory, | Následující tabulka ukazuje úspěšnost DZ parseru s výchozím nastavením na průběžných testovacích datech CoNLL, s původními neupravenými značkami CoNLL (tabulátory, | ||
+ | Úspěšnost parsingu s& | ||
| Jazyk | Rok | P | | | Jazyk | Rok | P | | ||
| ar | 2006 | 63.9 | | | ar | 2006 | 63.9 | | ||
Line 52: | Line 51: | ||
| bg | 2006 | 72.3 | | | bg | 2006 | 72.3 | | ||
| ca | 2007 | 72.7 | | | ca | 2007 | 72.7 | | ||
+ | | ca | 2009 | 73.6 | | ||
| cs | 2006 | 64.1 | | | cs | 2006 | 64.1 | | ||
| cs | 2007 | 69.1 | | | cs | 2007 | 69.1 | | ||
+ | | cs | 2009 | 65.8 | | ||
| da | 2006 | 69.9 | | | da | 2006 | 69.9 | | ||
| de | 2006 | 71.8 | | | de | 2006 | 71.8 | | ||
+ | | de | 2009 | 72.3 | | ||
| el | 2007 | 65.0 | | | el | 2007 | 65.0 | | ||
| en | 2007 | 70.6 | | | en | 2007 | 70.6 | | ||
+ | | en | 2009 | 69.5 | | ||
+ | | es | 2009 | 71.8 | | ||
| eu | 2007 | 58.6 | | | eu | 2007 | 58.6 | | ||
| hu | 2007 | 62.3 | | | hu | 2007 | 62.3 | | ||
| it | 2007 | 71.5 | | | it | 2007 | 71.5 | | ||
| ja | 2006 | 87.3 | | | ja | 2006 | 87.3 | | ||
+ | | ja | 2009 | 83.2 | | ||
| nl | 2006 | 73.7 | | | nl | 2006 | 73.7 | | ||
| pt | 2006 | 73.8 | | | pt | 2006 | 73.8 | | ||
Line 69: | Line 74: | ||
| zh | 2006 | 69.9 | | | zh | 2006 | 69.9 | | ||
| zh | 2007 | 69.0 | | | zh | 2007 | 69.0 | | ||
+ | | zh | 2009 | 57.7 | | ||
Následující tabulka srovnává výsledky s původními značkami CoNLL a výsledky se značkami PDT. Data jsou dtest. Nastavení parseru je výchozí, tj. úprava značek ani selektivní lexikalizace není zapnuta. Poslední sloupec říká, zda je změna úspěšnosti statisticky významná podle McNemarova testu na úrovni 0,05 (χ< | Následující tabulka srovnává výsledky s původními značkami CoNLL a výsledky se značkami PDT. Data jsou dtest. Nastavení parseru je výchozí, tj. úprava značek ani selektivní lexikalizace není zapnuta. Poslední sloupec říká, zda je změna úspěšnosti statisticky významná podle McNemarova testu na úrovni 0,05 (χ< | ||
Line 79: | Line 85: | ||
| cs | 2007 | 69.1 | 68.6 | horší | ano (3.948357) | | | cs | 2007 | 69.1 | 68.6 | horší | ano (3.948357) | | ||
| da | 2006 | 69.9 | 70.5 | lepší | ne (2.082218) | | | da | 2006 | 69.9 | 70.5 | lepší | ne (2.082218) | | ||
+ | | de | 2006 | 71.8 | 67.5 | horší | ano (61.301887) | | ||
| en | 2007 | 70.6 | 65.4 | horší | ano (227.951382) | | | en | 2007 | 70.6 | 65.4 | horší | ano (227.951382) | | ||
+ | | pt | 2006 | 73.8 | 76.4 | lepší | ano (44.312588) | | ||
| sv | 2006 | 71.0 | 72.6 | lepší | ano (12.763713) | | | sv | 2006 | 71.0 | 72.6 | lepší | ano (12.763713) | | ||
| zh | 2006 | 69.9 | 68.4 | horší | ne (1.574297) | | | zh | 2006 | 69.9 | 68.4 | horší | ne (1.574297) | | ||
Line 187: | Line 195: | ||
| zh | 2006 | 69.9 | 68.0 | horší | ne (2.623482) | | | zh | 2006 | 69.9 | 68.0 | horší | ne (2.623482) | | ||
| zh | 2007 | 69.0 | 63.5 | horší | ano (23.875776) | | | zh | 2007 | 69.0 | 63.5 | horší | ano (23.875776) | | ||
- | |||
- | |||
==== 03: navíc zapnuté modelování pseudovalence ==== | ==== 03: navíc zapnuté modelování pseudovalence ==== | ||
Line 245: | Line 251: | ||
| zh | 2006 | 69.9 | 68.8 | horší | ne (0.757576) | | | zh | 2006 | 69.9 | 68.8 | horší | ne (0.757576) | | ||
| zh | 2007 | 69.0 | 64.6 | horší | ano (14.266376) | | | zh | 2007 | 69.0 | 64.6 | horší | ano (14.266376) | | ||
+ | |||
+ | ===== Která konfigurace je nejúspěšnější pro který jazyk? ===== | ||
+ | |||
+ | | Jazyk | Rok | orig df | pdt df | orig 03 | pdt 03 | | ||
+ | | ar | 2006 | 63.9 | 66.8 | 64.4 | 67.6 | | ||
+ | | ar | 2007 | 64.9 | 64.2 | 59.8 | 67.0 | | ||
+ | | bg | 2006 | 72.3 | 71.2 | 67.6 | 71.0 | | ||
+ | | ca | 2007 | 72.7 | | 69.9 | | | ||
+ | | cs | 2006 | 64.1 | 64.1 | 56.0 | 71.4 | | ||
+ | | cs | 2007 | 69.1 | 68.6 | 58.7 | 74.3 | | ||
+ | | da | 2006 | 69.9 | 70.5 | 68.3 | 69.8 | | ||
+ | | de | 2006 | 71.8 | 67.5 | 69.5 | 67.7 | | ||
+ | | el | 2007 | 65.0 | | 67.2 | | | ||
+ | | en | 2007 | 70.6 | 65.4 | 64.2 | 67.9 | | ||
+ | | eu | 2007 | 58.6 | | 58.4 | | | ||
+ | | hu | 2007 | 62.3 | | 62.3 | | | ||
+ | | it | 2007 | 71.5 | | 72.2 | | | ||
+ | | ja | 2006 | 87.3 | | 74.9 | | | ||
+ | | nl | 2006 | 73.7 | | 73.2 | | | ||
+ | | pt | 2006 | 73.8 | 76.4 | 73.5 | 76.4 | | ||
+ | | sl | 2006 | 58.7 | | 63.8 | | | ||
+ | | sv | 2006 | 71.0 | 72.6 | 71.0 | 73.2 | | ||
+ | | tr | 2007 | 64.6 | | 65.2 | | | ||
+ | | zh | 2006 | 69.9 | 68.4 | 67.5 | 68.8 | | ||
+ | | zh | 2007 | 69.0 | 63.7 | 64.6 | 64.6 | | ||
===== Starší poznámky ===== | ===== Starší poznámky ===== |