Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:dz-parser:icon [2012/10/09 19:39] zeman Rychlé poznámky ohledně nové soutěže v hindštině. |
user:zeman:dz-parser:icon [2012/12/07 13:57] zeman Udělat. |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Hindi Parsing Shared Task at COLING 2012 Mumbaí | + | ====== Hindi Parsing Shared Task at COLING 2012 Mumbaī |
+ | |||
+ | http:// | ||
+ | |||
+ | ===== Udělat ===== | ||
+ | |||
+ | * Natrénovat McDonaldův MST parser. Pokud možno s pořádnými rysy, neprojektivně a druhý řád. Ale na druhou stranu, aby to taky někdy doběhlo. | ||
+ | * Ambati et al. použili 2. řád a training-k = 5. | ||
+ | * Zkontrolovat normalizaci UTF-8 (dévanágarí). | ||
+ | * Natrénovat Malt parser a mezi rysy mu přidat hypotézu od MST (parser MST-Malt podle Joakimova a Ryanova článku). | ||
+ | * Natrénovat samostatný značkovač syntaktických značek. Ambati et al.: MST labeler je blbej, použili maxent (http...lzhang, | ||
+ | * Potřebuju nějaké vyhledávadlo a zvýrazňovadlo chyb. | ||
+ | * Opravit normalizaci pro HamleDT. Normalizace hindštiny prý dělá na nových datech mnohem více chyb (uzel pod Coord nemá is_member apod.) Mohly by mi pomoct Martinovy transformace koordinací? | ||
+ | |||
+ | HTB verze 0,51: train 12041 sent, 268093 tok? (words), dev 1233 / 26416 | ||
Vyhodnotit samostatně | Vyhodnotit samostatně | ||
Line 5: | Line 19: | ||
* uvnitř chunku vs. mezi chunky | * uvnitř chunku vs. mezi chunky | ||
* pro jednotlivé s-značky | * pro jednotlivé s-značky | ||
- | |||
- | McDonald? | ||
- | |||
- | Ambati et al.: MST labeler je blbej, použili maxent (http...lzhang, | ||
- | |||
- | A co MST druhého řádu? Ambati et al. použili 2. řád a training-k = 5. | ||
- | |||
- | MST jako vstupní featura pro Malt? | ||
- | |||
- | Potřebuju nějaké vyhledávadlo a zvýrazňovadlo chyb. | ||
- | |||
- | Mohly by pomoct Martinovy transformace? | ||
- | |||
- | Co ten neoznačkovaný text? TreeTagger? | ||
====== ICON 2009 NLP Tools Contest ====== | ====== ICON 2009 NLP Tools Contest ====== |