[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:interset:brainstorming [2008/04/24 17:26]
zeman Quantos.
user:zeman:interset:brainstorming [2009/04/04 17:47]
zeman Jak se řeší číslovky v jednotlivých sadách?
Line 248: Line 248:
  
 Tohle celé by mohlo být zachyceno v nějakém rysu numtype (analogie k prontype), kde by bylo card, ord, mult atd. Přijde mi ale trochu divné označovat neurčité číslovky za kardinální čísla. Další možnost je advtype (popř. reftype), kde by bylo vedle loc, tim a man taky qnt (quantity). Problém s pojmenováním rysu tkví v tom, že v češtině máme druhové číslovky kolikerý apod., které moc nepoužíváme, zatímco v portugalštině se číslovka kolik často používá jako determinátor, který se shoduje s počítaným podstatným jménem v rodě a čísle (quantos, quantas). Zatím tedy budu podobná slova odlišovat pomocí subpos = card, ale výhledově vymyslím něco lepšího. Tohle celé by mohlo být zachyceno v nějakém rysu numtype (analogie k prontype), kde by bylo card, ord, mult atd. Přijde mi ale trochu divné označovat neurčité číslovky za kardinální čísla. Další možnost je advtype (popř. reftype), kde by bylo vedle loc, tim a man taky qnt (quantity). Problém s pojmenováním rysu tkví v tom, že v češtině máme druhové číslovky kolikerý apod., které moc nepoužíváme, zatímco v portugalštině se číslovka kolik často používá jako determinátor, který se shoduje s počítaným podstatným jménem v rodě a čísle (quantos, quantas). Zatím tedy budu podobná slova odlišovat pomocí subpos = card, ale výhledově vymyslím něco lepšího.
 +
 +===== Numerals =====
 +
 +===== Approaches taken in various tagsets =====
 +
 +==== cs::pdt ====
 +
 +Many types of numerals. Numeral types (e.g. cardinal vs. ordinal) and pronoun types (e.g. indefinite, interrogative) are mixed together. There are following subclasses:
 +
 +''C='' = numerals written using digits ("14")
 +''C}'' = Roman numerals ("MCMLXXI")
 +''Cl'' = cardinal numbers ("jeden", "dva", "tři", "čtyři")
 +''Cn'' = cardinal numbers ("pět", "šest", "sedm", ...)
 +''C?'' = interrogative or relative ("kolik")
 +''Ca'' = indefinite ("několik", "mnoho", "málo", "kdovíkolik", "tolik")
 +''Cy'' = fraction denominators ("polovina", "třetina", "čtvrtina", "setina", "tisícina", ...)
 +''Cj'' = generic numerals ("čtvero", "patero", "desatero")
 +''Ck'' = generic numerals ("čtvery", "patery", "desatery")
 +''Cr'' = ordinal numbers ("první", "druhý", "třetí", "čtvrtý", "pátý", "stý", "tisící", ...)
 +''Cz'' = interrogative or relative ordinals ("kolikátý")
 +''Cd'' = generic numerals ("jedny", "dvojí", "desaterý")
 +''Ch'' = generic numerals ("jedny", "nejedny")
 +''Cw'' = indefinite ordinals ("nejeden", "tolikátý")
 +''Cv'' = multiplicative adverbial numerals ("jedenkrát", "dvakrát", "třikrát", "stokrát", ...)
 +''Cu'' = interrogative or relative multiplicative adverbial numerals ("kolikrát")
 +''Co'' = indefinite multiplicative adverbial numerals ("několikrát", "mnohokrát", "tolikrát", ...)
 +''C3'' = abbreviated numeral
 +
 +==== cs::multext ====
 +
 +There are two orthogonal sets of subclasses:
 +
 +''Mc'' = cardinal numbers
 +''Mo'' = ordinal numbers
 +''Mm'' = multiplier numbers
 +''Ms'' = generic numerals ("desaterý", "dvojí", "jeden", "několikerý", "několikery", "obojí")
 +
 +''M.1'' = definite1 ("jeden", "první")
 +''M.2'' = definite2 ("druhý", "dvojí", "dvojnásob", "dva", "nadvakrát", "oba", "obojí")
 +''M.3'' = definite34 ("čtvrtý", "čtyři", "potřetí", "tři", "třetí", "třikrát")
 +''M.f'' = definite ("1929", "čtrnáctý", "čtyřiapadesát", "dvoustý", "tucet", ...)
 +''M.d'' = demonstrative ("tolik", "tolikrát")
 +''M.i'' = indefinite ("bezpočet", "bezpočtukrát", "bůhvíkolik", "hodně", "málo", "mnohý", "mockrát", "několik", "několikerý", "několikrát", "nejeden", "pár", "vícekrát")
 +''M.q'' = interrogative ("kolik", "kolikrát")
 +''M.r'' = relative ("kolik", "kolikrát")
 +
 +==== bg::conll ====
 +
 +==== en::penn ====
 +
 +==== de::stts ====
 +
 +==== da::conll ====
 +
 +==== sv::hajic ====
 +
 +==== sv::mamba ====
 +
 +==== pt::conll ====
 +
 +==== ar::conll ====
 +
 +==== zh::conll ====
 +
 +Determiners and cardinal numbers are in the same group (''Ne''):
 +
 +''Nep'' = anaphoric determiner ("this", "that")
 +''Neq'' = classifying determiner ("much", "half")
 +''Nes'' = specific determiner ("you", "shang", "ge"=every)
 +''Neu'' = numeric determiner ("one", "two", "three")

[ Back to the navigation ] [ Back to the content ]