[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision Both sides next revision
user:zeman:dz-parser:icon [2009/10/20 18:05]
zeman vytvořeno
user:zeman:dz-parser:icon [2009/10/20 18:20]
zeman Zbývá udělat.
Line 3: Line 3:
 Soutěž v závislostní syntaktické analýze hindštiny, bengálštiny a telugštiny. Něco jako CoNLL-X a 2007 shared task, ale pro indické jazyky. Tentokrát nezkouším jen DZ Parser, ale hlasující kombinaci tří parserů: Malt parseru, MST parseru a DZ parseru. Soutěž v závislostní syntaktické analýze hindštiny, bengálštiny a telugštiny. Něco jako CoNLL-X a 2007 shared task, ale pro indické jazyky. Tentokrát nezkouším jen DZ Parser, ale hlasující kombinaci tří parserů: Malt parseru, MST parseru a DZ parseru.
  
-Indický parsing - to do:+===== Zbývá udělat =====
  
-- Převod z CSTS do CoNLL 2006 není v pořádku. Asi i proto mi vychází úspěšnost 100 %+  * Vyzkoušet neprojektivní parsing MST parserem
-- Pokusit se rozchodit a natrénovat MST Parser. Pokud se to podařípokračovat rozcházení hlasování 3 parserů. +  * Zjistitproč je tolik chyb syntaktickém značkování, vylepšit ho. Třeba pomocí jakého toolkitu pro strojové učení (Mallet apod.) 
-- Makefile případné další soubory specifické pro tuto úlohu přenést do kterého svého repozitáře SVN. +  * Vybrat SVN repozitář, do kterého tyto pokusy budu archivovat, vybrat soubory, které tam patří (Makefilespecifické skriptyvstupní data, soubory s vyhodnocením...) dát je tam
-- Zjistitzda je Malt parser a MST parser také horší, když se mu dá morfologie, a o kolik+  * Vyhodnotit křivku učení
-- Zjistit, které rysy co znamenají. Prozkoumat, zda nepomůže přibrat do značky pád+  * Napsat článek
-- Zdá se, že lemma bylo také součástí morfologické anotace a není součástí "obyčejných" ssf souborů+  * Více si pohrát s rysy. 
-- Totéž zřejmě platí o značce slovního druhu – přehlédl jsem, že v souborech ssf se opakuje značka chunku!+  * Více si pohrát s konfigurací Malt parseru.
  
 První výsledky DZ Parseru na vývojových datech: První výsledky DZ Parseru na vývojových datech:

[ Back to the navigation ] [ Back to the content ]