[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:malt-parser [2010/03/28 10:51]
zeman Cyklus.
user:zeman:malt-parser [2010/03/30 16:10]
zeman
Line 46: Line 46:
 procesor 64bit dual core AMD Opteron 2 GHz procesor 64bit dual core AMD Opteron 2 GHz
 paměť 16 GB, ale proces zabírá jen 4,1 GB paměť 16 GB, ale proces zabírá jen 4,1 GB
 +
 +
 +
 +
 +
  
  
Line 57: Line 62:
 <code>foreach i (1000 2000 5000 10000 20000 50000) <code>foreach i (1000 2000 5000 10000 20000 50000)
   $PARSINGROOT/malt-parser/marco-kuhlmann-czech-settings/conll-pdttags2conll.pl < dtrain-$i.conll > dtrain-$i.conll2009tags.conll   $PARSINGROOT/malt-parser/marco-kuhlmann-czech-settings/conll-pdttags2conll.pl < dtrain-$i.conll > dtrain-$i.conll2009tags.conll
 +end
 +foreach i (dtrain dtest)
 +  $PARSINGROOT/malt-parser/marco-kuhlmann-czech-settings/conll-pdttags2conll.pl < $i.conll > $i.conll2009tags.conll
 +end
 +foreach i (25000 30000 35000 40000 45000 55000 60000 65000)
 +  split_conll.pl < dtrain.conll2009tags.conll -head $i dtrain-$i.conll2009tags.conll /dev/null
 end</code> end</code>
 +
 +Učení:
 +
 +<code>qsub.csh mf=31g $PARSINGROOT/malt-parser/scripts/train.pl '<' dtrain-1000.conll2009tags.conll1 '>' d.pokus1000-30g-clibsvm.mco</code>
 +
 +Rozbor:
 +
 +<code>qsub.csh mf=31g $PARSINGROOT/malt-parser/scripts/parse.pl -g d.pokus1000-30g-clibsvm.mco '<' dtest.conll2009tags.conll '>' dtest.malt-pokus1000-30g-clibsvm.conll</code>
 +
 +Vyhodnocení:
 +
 +<code>$PARSINGROOT/tools/conll-eval07.pl -g dtest.conll2009tags.conll -s dtest.malt-pokus1000-30g-clibsvm.conll > dtest.malt-pokus1000-30g-clibsvm.eval.txt</code>
 +
 +Trénování na části trénovacích dat (prvních N vět). Testování je vždy na celém dtestu, tedy 9270 vět.
 +
 +| N | TÚloha | Délka trénování | PÚloha | Délka parsingu | Rychlost parsingu | Úspěšnost |
 +| 1000 | | 1 minuta | | 1248 s = 20:48 min | 1 věta / 0,13 s | 74,63 % |
 +| 2000 | | 4 minuty | | 1885 s = 31:25 min | 1 věta / 0,20 s | 77,73 % |
 +| 5000 | | 30 minut | | 5534 s = 1:32 hod | 1 věta / 0,60 s | 80,18 % |
 +| 10000 | | 1:30 hod | | 7171 s = 2:00 hod | 1 věta / 0,77 s | 82,11 % |
 +| 20000 | | 10:09 hod | | 17139 s = 4:45 hod | 1 věta / 1,85 s | 83,65 % |
 +| 25000 | 984089 | 12:12 hod | 984241 | 16031 s = 4:27 hod | 1 věta / 1,73 s | 84,24 % |
 +| 30000 | 984090 | 21:54 hod | 984266 | 19280 s = 5:21 hod | 1 věta / 2,08 s | 84,54 % |
 +| 35000 | 984091 | 21:09 hod | 984242 | 22018 s = 6:07 hod | 1 věta / 2,38 s | 84,89 % |
 +| 40000 | 984092 | spadlo na ''sdm0.003.libsvm.mod'' | | | | |
 +| 45000 | 984093 | | | | | |
 +| 50000 | 984030 | 49:55 hod | 984336 | | | |
 +| 55000 | 984094 | spadlo na ''sdm0.004.libsvm.mod'' | | | | |
 +| 60000 | 984095 | spadlo na ''sdm0.004.libsvm.mod'' | | | | |
 +| 65000 | 984096 | spadlo na ''sdm0.004.libsvm.mod'' | | | | |
 +| 68563 | | spadlo na ''sdm0.004.libsvm.mod'' | | | | |
  
 ==== Co dál? ==== ==== Co dál? ====

[ Back to the navigation ] [ Back to the content ]