Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Last revision Both sides next revision | ||
user:zeman:dz-parser [2007/03/30 08:04] zeman Hotovo. |
user:zeman:dz-parser [2007/05/16 10:24] zeman Programátorská dokumentace. |
||
---|---|---|---|
Line 5: | Line 5: | ||
< | < | ||
- | | + | Následující části byly vyčleněny do samostatných stránek. Viz též obsah této stránky vpravo nahoře. |
- | * [[user: | + | |
- | * [[user: | + | |
+ | * [[user: | ||
* [[user: | * [[user: | ||
+ | * [[user: | ||
* [[user: | * [[user: | ||
Line 20: | Line 22: | ||
* Totéž, ale navíc rys pád. | * Totéž, ale navíc rys pád. | ||
* Učit se na morfologických značkách překódovaných do sady PDT. | * Učit se na morfologických značkách překódovaných do sady PDT. | ||
- | * Kombinace parserů (Brown, McDonald, Stanford). | + | * Kombinace parserů ([[:Parsery|Brown]], [[:MST|McDonald]], [[:Parsery|Stanford]]). |
* Angličtina (větev adaptace na novou doménu)? | * Angličtina (větev adaptace na novou doménu)? | ||
* Vše přetrénovat na celých trénovacích datech, rozebrat slepá testovací data a do soboty odeslat výsledky. | * Vše přetrénovat na celých trénovacích datech, rozebrat slepá testovací data a do soboty odeslat výsledky. | ||
- | * Nová regrese na PDT 2.0 a commit (změny v ud.pm). Co je nového? Možnost vypnout rozepisování alternativ! U CoNLL to může uškodit, ale nemůže | + | * Následující už je asi vyřešeno, ale je třeba |
- | * Vyřešit situaci, kdy svislítko ve vstupních datech (značkách, | + | |
* Půjde zřejmě o rozsáhlejší přestavbu funkce ud(), kterou bude potřeba pečlivě otestovat na parsingu PDT. Součástí přestavby by mělo být i to, že parametrem funkce už nebude jeden řetězec, ale pole, kde prvním prvkem bude typ události a další prvky budou její parametry. Pak bude jasné, že na alternativy se dělí každý parametr zvlášť a že je potřeba nakombinovat všechny alternativy všech parametrů. | * Půjde zřejmě o rozsáhlejší přestavbu funkce ud(), kterou bude potřeba pečlivě otestovat na parsingu PDT. Součástí přestavby by mělo být i to, že parametrem funkce už nebude jeden řetězec, ale pole, kde prvním prvkem bude typ události a další prvky budou její parametry. Pak bude jasné, že na alternativy se dělí každý parametr zvlášť a že je potřeba nakombinovat všechny alternativy všech parametrů. | ||
* Odstranit závislost parseru na konfiguračním souboru '' | * Odstranit závislost parseru na konfiguračním souboru '' |