[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:interset:drivers [2008/04/03 11:49]
zeman Restructuralization.
user:zeman:interset:drivers [2008/04/03 14:16]
zeman Restructuralization.
Line 46: Line 46:
  
 ===== English (en) ===== ===== English (en) =====
 +
 +==== Penn Treebank Tagset ====
  
 Penn Treebank (45 atomic tags). Detailed classification of punctuation. Penn Treebank (45 atomic tags). Detailed classification of punctuation.
  
 Total work time: about 3 hours Total work time: about 3 hours
 +
 +==== CoNLL Tagset (derived from Penn tags) ====
 +
 +The driver is just an envelope around the ''en::penn'' driver.
 +
 +Total work time: 48 minutes
  
 ===== German (de) ===== ===== German (de) =====
Line 96: Line 104:
 0:20+1:00+0:26+5:44+2:00+6:15+1:20+0:46+1:26+2:30+0:48+12:44 = 35:19 0:20+1:00+0:26+5:44+2:00+6:15+1:20+0:46+1:26+2:30+0:48+12:44 = 35:19
 (ale u bulharštiny jsem se dost natrápil s jevy, které do té doby nebyly v intersetu podchycené) (ale u bulharštiny jsem se dost natrápil s jevy, které do té doby nebyly v intersetu podchycené)
- 
-Anglické značky CoNLL 
-0:48 - možná tady chybí statistika, ale možná taky ne, protože stačilo upravit existující ovladač Penn Treebanku, ne? 
  
 Žádné z výše uvedených převodů (tedy vše napsané před říjnem 2007) ještě neměly k dispozici chytré funkce pro nahrazování nepovolených hodnot. Žádné z výše uvedených převodů (tedy vše napsané před říjnem 2007) ještě neměly k dispozici chytré funkce pro nahrazování nepovolených hodnot.
  

[ Back to the navigation ] [ Back to the content ]