[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Last revision Both sides next revision
user:zeman:dz-parser:conll [2009/03/13 18:24]
zeman Sémantika.
user:zeman:dz-parser:conll [2009/03/13 18:25]
zeman A pak ještě Makefile.
Line 40: Line 40:
   * ''harvest.csh'' ... pro všechny roky a jazyky (a u korpusů, u kterých to umíme, i pro data se značkami převedenými do PDT) zavolá ''porovnat.pl'' na zlatý standard a výstup parseru, čímž kromě úspěšnosti získáme i McNemarův test statistické významnosti zlepšení nebo zhoršení, které přinesl převod značek oproti datům s původními značkami   * ''harvest.csh'' ... pro všechny roky a jazyky (a u korpusů, u kterých to umíme, i pro data se značkami převedenými do PDT) zavolá ''porovnat.pl'' na zlatý standard a výstup parseru, čímž kromě úspěšnosti získáme i McNemarův test statistické významnosti zlepšení nebo zhoršení, které přinesl převod značek oproti datům s původními značkami
   * ''vypsat_tabulku.pl'' dělá podobnou věc jako ''harvest.csh'', ale výsledky rovnou formátuje jako tabulku, kterou můžeme uložit v této wiki. Má parametr ''INI'', který říká, jaké výsledky (získané s jakým konfiguračním souborem) se mají sbírat.   * ''vypsat_tabulku.pl'' dělá podobnou věc jako ''harvest.csh'', ale výsledky rovnou formátuje jako tabulku, kterou můžeme uložit v této wiki. Má parametr ''INI'', který říká, jaké výsledky (získané s jakým konfiguračním souborem) se mají sbírat.
 +
  
 ===== Sémantika 2009 ===== ===== Sémantika 2009 =====
Line 54: Line 55:
     * Pro každou větu spočítat, kolik uzlů má nastaveno FILLPRED = "Y". Tolik bude u každého uzlu sloupců APREDs.     * Pro každou větu spočítat, kolik uzlů má nastaveno FILLPRED = "Y". Tolik bude u každého uzlu sloupců APREDs.
     * Zapamatovat si, které predikáty závisí na jiných predikátech (popř. si rovnou zapamatovat celý strom). U každého predikátu pak střelit nějakou hodnotu APRED do všech sloupců, které na něm závisí. Do ostatních vyplnit "_".     * Zapamatovat si, které predikáty závisí na jiných predikátech (popř. si rovnou zapamatovat celý strom). U každého predikátu pak střelit nějakou hodnotu APRED do všech sloupců, které na něm závisí. Do ostatních vyplnit "_".
 +  * Až tyhle skripty budou, zapracovat je do Makefilu a získat baseline výsledek pro všechny jazyky.
  
 ===== Výsledky ===== ===== Výsledky =====

[ Back to the navigation ] [ Back to the content ]