Differences
This shows you the differences between two versions of the page.
Next revision Both sides next revision | |||
user:zeman:dz-parser:icon [2009/10/20 18:05] zeman vytvořeno |
user:zeman:dz-parser:icon [2009/10/20 18:20] zeman Zbývá udělat. |
||
---|---|---|---|
Line 3: | Line 3: | ||
Soutěž v závislostní syntaktické analýze hindštiny, bengálštiny a telugštiny. Něco jako CoNLL-X a 2007 shared task, ale pro indické jazyky. Tentokrát nezkouším jen DZ Parser, ale hlasující kombinaci tří parserů: Malt parseru, MST parseru a DZ parseru. | Soutěž v závislostní syntaktické analýze hindštiny, bengálštiny a telugštiny. Něco jako CoNLL-X a 2007 shared task, ale pro indické jazyky. Tentokrát nezkouším jen DZ Parser, ale hlasující kombinaci tří parserů: Malt parseru, MST parseru a DZ parseru. | ||
- | Indický parsing - to do: | + | ===== Zbývá udělat ===== |
- | - Převod z CSTS do CoNLL 2006 není v pořádku. Asi i proto mi vychází úspěšnost 100 %. | + | * Vyzkoušet neprojektivní parsing MST parserem. |
- | - Pokusit se rozchodit a natrénovat MST Parser. Pokud se to podaří, pokračovat v rozcházení hlasování 3 parserů. | + | * Zjistit, proč je tolik chyb v syntaktickém značkování, |
- | - Makefile | + | * Vybrat SVN repozitář, |
- | - Zjistit, zda je Malt parser a MST parser také horší, když se mu dá morfologie, a o kolik. | + | * Vyhodnotit křivku učení. |
- | - Zjistit, které rysy co znamenají. Prozkoumat, zda nepomůže přibrat do značky pád. | + | * Napsat |
- | - Zdá se, že lemma bylo také součástí morfologické anotace a není součástí " | + | * Více si pohrát s rysy. |
- | - Totéž zřejmě platí o značce slovního druhu – přehlédl jsem, že v souborech ssf se opakuje značka chunku! | + | * Více si pohrát s konfigurací Malt parseru. |
První výsledky DZ Parseru na vývojových datech: | První výsledky DZ Parseru na vývojových datech: |