[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:interset:drivers [2008/03/26 08:56]
zeman cs::conll finished.
user:zeman:interset:drivers [2008/03/31 22:01]
zeman Stuttgart-Tübingen Tagset.
Line 26: Line 26:
  
 České značky PDT (přes 4000 značek; jádro Intersetu vzniklo jako vedlejší produkt, když jsem dělal tohle) asi 2 dny, tedy dejme tomu 18 hodin. Dalších 11:09 hodin jsem spotřeboval, když jsem začal ovladače testovat a musel jsem tenhle opravovat. Opět platí, že část času zabralo ladění testovacího skriptu, který v té době teprve vznikal. České značky PDT (přes 4000 značek; jádro Intersetu vzniklo jako vedlejší produkt, když jsem dělal tohle) asi 2 dny, tedy dejme tomu 18 hodin. Dalších 11:09 hodin jsem spotřeboval, když jsem začal ovladače testovat a musel jsem tenhle opravovat. Opět platí, že část času zabralo ladění testovacího skriptu, který v té době teprve vznikal.
- 
- 
  
 ==== CoNLL (derived from PDT) ==== ==== CoNLL (derived from PDT) ====
Line 40: Line 38:
  
 More than half of the time was consumed during testing for tuning tags containing the Sem feature. More than half of the time was consumed during testing for tuning tags containing the Sem feature.
 +
 +===== German (de) =====
 +
 +==== Stuttgart-Tübingen Tagset (STTS) ====
 +
 +This is the tagset used in the Tiger treebank. It is quite syntax-oriented, often the same word can be tagged in couple different ways according to its function in a particular sentence. Pronouns are systematically categorized as substitutive (occur instead of an NP), attributive (occur inside an NP) and adverbial.
 +
 +The tags omit inflectional information (number and case of pronouns and articles, degree of comparison of adjectives, tense (Präteritum, Konjunktiv), person and number of verbs).
 +
 +Work started: 29.3.2008
 +Work finished: 29.3.2008
 +Total work time: 4:00 h
  
 ===== Time needed for tag set conversion ===== ===== Time needed for tag set conversion =====

[ Back to the navigation ] [ Back to the content ]