[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:morpho-challenge-2008 [2008/07/28 16:27]
zeman Přidán kód pro vyhodnocování.
user:zeman:morpho-challenge-2008 [2008/07/31 13:32]
zeman Výsledky.
Line 44: Line 44:
 Seznam vzorů se buduje takto (práce je rozdělena do několika kroků, protože zpracování velkých dat trvá dlouho a při opravě nějaké drobnosti u filtrování vzorů nechceme muset opakovat i první dva kroky): Seznam vzorů se buduje takto (práce je rozdělena do několika kroků, protože zpracování velkých dat trvá dlouho a při opravě nějaké drobnosti u filtrování vzorů nechceme muset opakovat i první dva kroky):
 <code>csts2kmkon.pl < en.csts > en.kmkon <code>csts2kmkon.pl < en.csts > en.kmkon
-kmkon2vzor.pl < en.kmkon > en.vzor +kmkon2vzor.pl < en.kmkon > en.nefiltr 
-vzorfiltr.pl < en.vzor en1.vzor</code>+vzorfiltr.pl -okm en.kmeny.txt -okonc en.koncovky.txt < en.nefiltr en.vzor</code>
 Skript ''vzorfiltr.pl'' jako vedlejší účinek vedle standardního výstupu tiše vyrobí soubory ''kmeny.txt'' a ''koncovky.txt''. Skript ''vzorfiltr.pl'' jako vedlejší účinek vedle standardního výstupu tiše vyrobí soubory ''kmeny.txt'' a ''koncovky.txt''.
  
Line 61: Line 61:
   $MC/mchallenge.pl $l.kmeny.txt $l.koncovky.txt < wordlist.$l.txt > $l.dz.txt   $MC/mchallenge.pl $l.kmeny.txt $l.koncovky.txt < wordlist.$l.txt > $l.dz.txt
 end</code> end</code>
- 
  
 ===== Úprava výstupu před odesláním ===== ===== Úprava výstupu před odesláním =====
Line 78: Line 77:
 $MC/mc_convert.pl -t fi < fi.dz3.txt | gzip -c > wordlist.fin.dz3.gz $MC/mc_convert.pl -t fi < fi.dz3.txt | gzip -c > wordlist.fin.dz3.gz
 $MC/mc_convert.pl -t tr < tr.dz3.txt | gzip -c > wordlist.tur.dz3.gz</code> $MC/mc_convert.pl -t tr < tr.dz3.txt | gzip -c > wordlist.tur.dz3.gz</code>
 +
 +===== Vyhodnocení =====
 +
 +Moje vyhodnocení se bude lišit od oficiálních výsledků soutěže, protože mám k dispozici gold standard jen pro 500 slov z každého jazyka. Na prvním místě uvádím své výsledky, vpravo pak oficiální výsledky zveřejněné na stránkách soutěže.
 +
 +| Jazyk | F | P | R | Fo | Po | Ro |
 +| en | 48.56 | 53.39 | 44.53 | 46.90 | 52.98 | 42.07 |
 +| de | 27.67 | 30.28 | 25.47 | 36.98 | 53.12 | 28.37 |
 +| fi | 30.97 | 47.44 | 22.99 | 30.33 | 58.51 | 20.47 |
 +| tr | 32.68 | 59.46 | 22.53 | 29.23 | 65.81 | 18.79 |
 +| ar | 15.78 | 79.86 | 8.76 | 21.86 | 77.24 | 12.73 |
  
 ===== Zpracování převrácených slov a hledání předpon ===== ===== Zpracování převrácených slov a hledání předpon =====

[ Back to the navigation ] [ Back to the content ]