[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:zeman:interset:brainstorming [2009/04/04 17:47]
zeman Jak se řeší číslovky v jednotlivých sadách?
user:zeman:interset:brainstorming [2010/04/14 10:41] (current)
zeman Hierarchie zájmen v souvislosti s probíhající diskusí v ISOcatu.
Line 16: Line 16:
   * hromadné (collective) //(každý, všechen)//   * hromadné (collective) //(každý, všechen)//
   * záporné (negative)   * záporné (negative)
 +
  
 ==== Druhy číslovek ==== ==== Druhy číslovek ====
Line 44: Line 45:
 (Osobní i přivlastňovací zájmeno může být zvratné. Přivlastňovací může být nejen přivlastňovací zájmeno, ale také vztažné zájmeno ("jehož") a přídavné jméno.) (Osobní i přivlastňovací zájmeno může být zvratné. Přivlastňovací může být nejen přivlastňovací zájmeno, ale také vztažné zájmeno ("jehož") a přídavné jméno.)
  
-Kategorii určitosti a negace asi nemůžeme sloučit, pokud má negace současně sloužit i podstatným jménům, přídavným jménům a slovesům, protože podstatná a přídavná jména mohou být současně určitá i neurčitá. Nanejvýš bychom mohli informaci o záporu zdvojit (byla by u určitosti i ve zvláštní kategorii), ale to je asi blbost.+Kategorii určitosti a negace asi nemůžeme sloučit, pokud má negace současně sloužit i podstatným jménům, přídavným jménům a slovesům, protože podstatná a přídavná jména mohou být současně určitá i záporná. Nanejvýš bychom mohli informaci o záporu zdvojit (byla by u určitosti i ve zvláštní kategorii), ale to je asi blbost.
  
 Kategorii určitosti a vztažnosti už jsem sloučil a zatím to nevadí. Kategorii určitosti a vztažnosti už jsem sloučil a zatím to nevadí.
Line 295: Line 296:
  
 ==== bg::conll ==== ==== bg::conll ====
 +
 +Interrogative, relative, indefinite and demonstrative numerals are treated as pronouns. In addition, there are the following classes of numerals.
 +
 +''Mc'' = cardinal numbers
 +''Mo'' = ordinal numbers
 +''Md'' = adverbial numerals ("poveče", "malko", "mnogo", "măničko")
 +''My'' = fuzzy numerals about people ("malcina" = "few people", "mnozina" = "many people"); they resemble nouns
  
 ==== en::penn ==== ==== en::penn ====
 +
 +Only cardinal numbers have their own tag. Ordinals ("first") are tagged as adjectives (''JJ'') or adverbs (''RB''), depending on context. So are generic numerals ("sevenfold"). Multiplier numerals ("twice") are adverbs. Fractions ("quarter") are nouns (''NN'').
 +
 +''CD'' = cardinal numbers ("one", "two", "three", ...)
  
 ==== de::stts ==== ==== de::stts ====
 +
 +Only cardinal numbers have their own tag. Ordinals ("zweite") are tagged as adjectives (''ADJA'') or ("zweitens") as adverbs (''ADV''). Multiplier numerals ("zweimal") are adverbs. Fractions ("Drittel") are nouns (''NN''). Interrogative numerals ("wieviel") are tagged as pronouns/determiners (''PWAT'', ''PWS'').
 +
 +''CARD'' = cardinal numbers ("1986", "zwei", "fünf")
  
 ==== da::conll ==== ==== da::conll ====
 +
 +No top-level class for numerals. They are tagged as a subclass of adjectives. Interrogative numerals are probably classified as pronouns.
 +
 +''AC'' = cardinal numbers ("18.45", "tre", "fire", "seks")
 +''AO'' = ordinal numbers ("16.", "tredje", "anden", "fjerde")
 +''AN'' = normal adjectives
  
 ==== sv::hajic ==== ==== sv::hajic ====
 +
 +''MC'' = cardinal numbers
 +''MO'' = ordinal numbers
  
 ==== sv::mamba ==== ==== sv::mamba ====
 +
 +Interrogative numerals are probably tagged as pronouns.
 +
 +''RO'' = numeral (cardinal or ordinal) other than "en", "ett" (one): "hundra", "24", "två", "fjärde", "sjätte"
 +''EN'' = indefinite article or numeral "en", "ett" (one)
  
 ==== pt::conll ==== ==== pt::conll ====
 +
 +Interrogative numerals ("quanto") are tagged as pronouns/determiners. Ordinal numbers are adjectives.
 +
 +''num'' = number ("0,05", "cento_e_quatro", "cinco", "setenta_e_dois", "um", "zero")
 +''adj''...''<NUM-ord>'' = ordinal number ("primeiro")
  
 ==== ar::conll ==== ==== ar::conll ====
 +
 +The tag ''Q'' is used only for numbers written using digits. I do not know how numeral words are tagged, nor how ordinals and interrogatives are dealt with.
 +
 +''Q'' = number written using digits ("1948")
  
 ==== zh::conll ==== ==== zh::conll ====
Line 317: Line 356:
 ''Neq'' = classifying determiner ("much", "half") ''Neq'' = classifying determiner ("much", "half")
 ''Nes'' = specific determiner ("you", "shang", "ge"=every) ''Nes'' = specific determiner ("you", "shang", "ge"=every)
-''Neu'' = numeric determiner ("one", "two", "three")+''Neu'' = numeric determiner ("yi""one", "er""two", "san""three") 
 + 
 +===== Hlavní rozdíl Intersetu oproti Sašově hierarchii pro Intercorp ===== 
 + 
 +Jestliže se dívám na polské slovo "dziewiata" ("devátá"), dozvím se, že je to přídavné jméno, protože polská sada značek považuje řadové číslovky za přídavná jména. Interset mi ani nenaznačí, že u Poláků by také mohlo jít o řadovou číslovku, i když o konkrétním slově nevíme, zda je nebo není řadovou číslovkou. Saša chce naproti tomu mít hierarchii navrženou tak, aby znalost jazyka (resp. zdrojové sady značek) způsobila, že dotyčnou značku budeme interpretovat jako disjunkci přídavných jmen a řadových číslovek. 
 + 
 +Navíc tam má tři pohledy na klasifikaci slov: lexikální (sémantickou), morfologickou (flexivní typ, určuje relevantní morfologické kategorie) a syntaktickou (podle funkce ve větě; vztažné zájmeno "který" je syntakticky podstatné jméno). 
 + 
 +===== ISOcat a hierarchie druhů zájmen ===== 
 + 
 +  * pronoun 
 +    * adverbialInterrogativeRelativePronoun (de::stts::PWAV) 
 +    * affixedPersonalPronoun (???) 
 +    * allusivePronoun (???) 
 +    * conditionalPronoun (???) 
 +    * demonstrativePronoun 
 +      * attributiveDemonstrativePronoun (de::stts::PDAT) 
 +      * substitutingDemonstrativePronoun (de::stts::PDS) 
 +    * emphaticPronoun (???) 
 +    * exclamativePronoun (???) 
 +    * impersonalPronoun (???) 
 +    * indefinitePronoun 
 +      * attributiveIndefinitePronounWithDeterminer (de::stts::PIDAT) 
 +      * attributiveIndefinitePronounWithoutDeterminer (de::stts::PIAT) 
 +      * substitutingIndefinitePronoun (de::stts::PIS) 
 +    * interrogativePronoun 
 +      * attributiveInterrogativePronoun (de::stts::PWAT) 
 +      * substitutingInterrogativePronoun (de::stts::PWS) 
 +    * negativePronoun (DZ: although the distinction is not done in de::stts, there are also subclasses of attributives vs. substituting) 
 +    * personalPronoun 
 +      * irreflexivePersonalPronoun (de::stts::PPER) 
 +      * reflexivePersonalPronoun (de::stts::PRF) 
 +      * strongPersonalPronoun (???) 
 +      * weakPersonalPronoun (???) 
 +    * possessivePronoun 
 +      * attributivePossessivePronoun (de::stts::PPOSS) 
 +      * substitutingPossessivePronoun (de::stts::PPOSAT) 
 +      * reflexivePossessivePronoun (DZ; this could be either attributive or substituting) 
 +      * relativePossessivePronoun (DZ; this is probably only attributive) 
 +    * reciprocalPronoun 
 +    * reflexivePronoun (not personal???
 +    * relativePronoun 
 +      * attributiveRelativePronoun (de::stts::PRELAT) 
 +      * substitutingRelativePronoun (de::stts::PRELS) 
 +    * existentialTherePronoun (en::multext) 
 +    * collectivePronoun (bg::bultreebank) 
 +    * prepositionWithPronoun (cs: "proň" = "pro" + "něj", "oč" = "o" + "co"
 +    * pronounWithAuxiliary (cs: "tys" = "ty" + "jsi", "kdos" = "kdo" + "jsi")

[ Back to the navigation ] [ Back to the content ]