Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:interset:drivers [2008/04/03 11:49] zeman Restructuralization. |
user:zeman:interset:drivers [2008/04/03 14:16] zeman Restructuralization. |
||
---|---|---|---|
Line 46: | Line 46: | ||
===== English (en) ===== | ===== English (en) ===== | ||
+ | |||
+ | ==== Penn Treebank Tagset ==== | ||
Penn Treebank (45 atomic tags). Detailed classification of punctuation. | Penn Treebank (45 atomic tags). Detailed classification of punctuation. | ||
Total work time: about 3 hours | Total work time: about 3 hours | ||
+ | |||
+ | ==== CoNLL Tagset (derived from Penn tags) ==== | ||
+ | |||
+ | The driver is just an envelope around the '' | ||
+ | |||
+ | Total work time: 48 minutes | ||
===== German (de) ===== | ===== German (de) ===== | ||
Line 96: | Line 104: | ||
0: | 0: | ||
(ale u bulharštiny jsem se dost natrápil s jevy, které do té doby nebyly v intersetu podchycené) | (ale u bulharštiny jsem se dost natrápil s jevy, které do té doby nebyly v intersetu podchycené) | ||
- | |||
- | Anglické značky CoNLL | ||
- | 0:48 - možná tady chybí statistika, ale možná taky ne, protože stačilo upravit existující ovladač Penn Treebanku, ne? | ||
Žádné z výše uvedených převodů (tedy vše napsané před říjnem 2007) ještě neměly k dispozici chytré funkce pro nahrazování nepovolených hodnot. | Žádné z výše uvedených převodů (tedy vše napsané před říjnem 2007) ještě neměly k dispozici chytré funkce pro nahrazování nepovolených hodnot. | ||