Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:dz-parser:icon [2009/10/20 18:20] zeman Zbývá udělat. |
user:zeman:dz-parser:icon [2009/10/20 18:29] zeman Průzkum dat. |
||
---|---|---|---|
Line 12: | Line 12: | ||
* Více si pohrát s rysy. | * Více si pohrát s rysy. | ||
* Více si pohrát s konfigurací Malt parseru. | * Více si pohrát s konfigurací Malt parseru. | ||
+ | |||
+ | ===== Průzkum dat ===== | ||
+ | |||
+ | Jak je zvykem, máme k dispozici data pro (d)trénink, | ||
+ | |||
+ | Následující statistiky pocházejí ze souborů pro dtrénink s automatickou morfologií: | ||
+ | |||
+ | | Jazyk | Výskytů slov | Tvarů | Lemmat | ChunkPOS | POS+case+postpos | FEATS | | ||
+ | | hindština | 13779 | 3973 | 3134 | 10 | 297 | 714 | | ||
+ | | bengálština | 6449 | 2997 | 2336 | 14 | 398 | 367 | | ||
+ | | telugština | 5494 | 2462 | 1403 | 12 | 409 | 453 | | ||
První výsledky DZ Parseru na vývojových datech: | První výsledky DZ Parseru na vývojových datech: |