[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:dusek:funktory [2011/10/05 14:48]
dusek
user:dusek:funktory [2012/07/23 11:09]
dusek
Line 6: Line 6:
  
 === Varianty pokusů, featury === === Varianty pokusů, featury ===
-  * vynechané koordinační funktory (měly by se dělat zvlášť)+
 == základní sada == == základní sada ==
   * technické: sent_id, word_id, parent, nodetype, is_generated (+functor)   * technické: sent_id, word_id, parent, nodetype, is_generated (+functor)
Line 22: Line 22:
   * s ef. rodiči místo topologických (''eff'')   * s ef. rodiči místo topologických (''eff'')
   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')   * s ef. rodiči a funktory rodiče a levých sourozenců jako featurami (''eff_tree'')
-  * s formémem a jeho částmi jako featurami místo sempos (''formeme'') -- **bude časem default, protože sempos neznám, dokud nemám funktor**+  * s formémem a jeho částmi jako featurami místo sempos (''formeme'') -- **bude default, protože sempos neznám, dokud nemám funktor** 
 +    * vč. stromové varianty (''formeme_tree''
 +  * s formémy a diatezí (''dia'', ''dia_tree'')
   * dělené podle t-lemmatu (''tlemma'')   * dělené podle t-lemmatu (''tlemma'')
   * //nové featury (??)//   * //nové featury (??)//
Line 32: Line 34:
  
 ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^
-fug, nominal |||| +fug2-dia_coap-c_fix | 2011-12-01 22:58 77.607 | 78.383 |
-| fug-base | 2011-10-04 05:45 | 79.068 | 79.264 | +
-| fug-eff | 2011-10-04 05:30 | 79.415 | 79.581 | +
-| fug-eff_tree | 2011-10-04 05:10 | 80.139 | 80.524 | +
-| fug-formeme | 2011-10-04 05:47 | 79.203 | 79.525 | +
-| fug-formeme_tree | 2011-10-04 07:40 | 80.005 | 80.368 | +
-| fug-tlemma | 2011-10-04 03:53 | 78.828 | 80.391 | +
-| fug1-base | 2011-10-05 11:44 | 79.043 | 79.305 | +
-| fug1-eff | 2011-10-05 11:41 | 79.398 | 79.638 | +
-| fug1-eff_tree | 2011-10-05 11:23 | 80.126 | 80.509 | +
-| fug1-formeme | 2011-10-05 14:12 | 78.976 | 79.268 | +
-| fug1-formeme_tree | 2011-10-05 09:34 | 79.773 | 80.088 | +
-| fug1-tlemma | 2011-10-05 00:41 | 78.846 | 80.400 | +
-| fug2-base | 2011-10-05 10:43 | 79.001 | 79.167 | +
-| fug2-eff | 2011-10-05 01:27 79.357 | 79.507 | +
-| fug2-eff_tree | 2011-10-05 09:31 | 80.102 | 80.443 | +
-| fug2-formeme | 2011-10-05 14:36 | 78.851 | 79.190 | +
-| fug2-formeme_tree | 2011-10-05 13:55 | 79.712 | 80.139 | +
-| fug2-tlemma | 2011-10-05 07:43 | 78.838 | 80.209 |+
  
-== vysvětlení == + 
-  * 1. vs. 2. verze formémů -- o trošku lepší arg. subst., jiné horší +== Vysvětlení == 
-    * u eff_tree jsou lepší všechny až na bez sempos a slovesa +  * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu (a je jich pak víc), ostatní jsou spíš horší
-  * eff: lepší (ale zato o hodně!) jsou jen slova visící na něčem bez semposu, ostatní jsou spíš horší+
     * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace)     * protože eff zřejmě dává mnohem lepší rooty (nepletou se tam koordinace)
-  * tlemma: v průměru v2 horší, není výrazně zjevnéjaká slova to kazí+  * diathesis tomu pomáhá jenom minimálně, skoro neznatelně se zlepší děti slovesjinak nikdo
  
-== výsledky na zlatých parsech -- bez formémů ==+== Výsledky na zlatých parsech -- bez formémů ==
  
 ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^ ^ pokus ^ datum ^ bez feature selection ^ s feature selection ^
Line 73: Line 56:
   * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře   * je vidět, že když se formémy vynechají, dopadá pokus na nich založený hůře
  
 +== Nastavení parametrů ==
 +
 +  * Bez feature selection vychází nejlíp:
 +
 +^ typ ^ cost ^ term. criterion ^
 +| adj | 1 / 2 | 0.1 |
 +| adv | 1 | 0.03 |
 +| v, n | 1 | 0.01 |
 +| ??? | 1 | 0.1 |
 +| - | 1 | 0.003 / 0.03 |
 +
 +== Poučení ==
 +
 +  * Nezapomínat na binarizaci, jinak to celé bude mít mizernou úspěšnost (65%)
 +  * Pozor na overtraining, zvlášť u hodně řídkých případů (adj, adv)
 +  * Pozor na data, ať v nich není nic, co je známé až potom
 +
 +=== Koordinační funktory ===
  
 +  * Je potřeba udělat, protože přesnost pravidel není valná (mají jen asi 4 možné funktory)
 +  * FixIsMember je asi vhodný, ale ne úplně nutný: v praxi zřejmě nedojde k tomu, aby koordinační funktor dostalo něco, co předtím nebyla koordinace, a naopak.

[ Back to the navigation ] [ Back to the content ]