Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:dz-parser [2007/03/28 12:34] zeman Přeuspořádání. |
user:zeman:dz-parser [2007/03/28 12:47] zeman Udělat - CoNLL 2007. |
||
---|---|---|---|
Line 3: | Line 3: | ||
DZ Parser má svoji stránku na adrese http:// | DZ Parser má svoji stránku na adrese http:// | ||
- | < | + | < |
- | svn checkout file:/// | + | |
- | </ | + | |
===== To do ===== | ===== To do ===== | ||
+ | * CoNLL 2007 | ||
+ | * Napsat program, který na základě závislostí (ručních nebo naučených), | ||
+ | * Zkusit ještě jednou pustit parser na všechny jazyky s vypnutým rozepisováním alternativ. | ||
+ | * Totéž, ale vypnout úpravy morfologických značek, na ne-PDT značkách to nemůže fungovat. | ||
+ | * Totéž, ale učit se pouze na podrobných slovních druzích, hodnoty rysů zahodit. | ||
+ | * Totéž, ale navíc rys pád. | ||
+ | * Učit se na morfologických značkách překódovaných do sady PDT. | ||
+ | * Angličtina (větev adaptace na novou doménu)? | ||
+ | * Vše přetrénovat na celých trénovacích datech, rozebrat slepá testovací data a do soboty odeslat výsledky. | ||
* Vyřešit situaci, kdy svislítko ve vstupních datech (značkách, | * Vyřešit situaci, kdy svislítko ve vstupních datech (značkách, | ||
* Půjde zřejmě o rozsáhlejší přestavbu funkce ud(), kterou bude potřeba pečlivě otestovat na parsingu PDT. Součástí přestavby by mělo být i to, že parametrem funkce už nebude jeden řetězec, ale pole, kde prvním prvkem bude typ události a další prvky budou její parametry. Pak bude jasné, že na alternativy se dělí každý parametr zvlášť a že je potřeba nakombinovat všechny alternativy všech parametrů. | * Půjde zřejmě o rozsáhlejší přestavbu funkce ud(), kterou bude potřeba pečlivě otestovat na parsingu PDT. Součástí přestavby by mělo být i to, že parametrem funkce už nebude jeden řetězec, ale pole, kde prvním prvkem bude typ události a další prvky budou její parametry. Pak bude jasné, že na alternativy se dělí každý parametr zvlášť a že je potřeba nakombinovat všechny alternativy všech parametrů. | ||
Line 40: | Line 47: | ||
===== Výsledky CoNLL 2007 ===== | ===== Výsledky CoNLL 2007 ===== | ||
+ | |||
+ | Viz též [[internal: | ||
+ | |||
+ | ==== Arabština ==== | ||
+ | |||
+ | < | ||
+ | parse.pl < / | ||
+ | |||
+ | G 3591 - P = < | ||
==== Baskičtina ==== | ==== Baskičtina ==== | ||
Line 98: | Line 114: | ||
A 6210 - G 4037 - B 2173 - P < | A 6210 - G 4037 - B 2173 - P < | ||
- |