Both sides previous revision
Previous revision
|
Next revision
Both sides next revision
|
user:zeman:interset:to-do [2008/03/31 15:00] zeman Values of feature tagset normalized in all drivers. |
user:zeman:interset:to-do [2008/03/31 15:01] zeman |
* Vymyslet koncepci pro stažené (contracted) tvary, kde se do jednoho slova dostaly dva různé slovní druhy. Zatím to na různých místech řeším různě. Patří sem české "proň", "bylť", německé "zum" a nejspíš další jevy v dalších jazycích. Zvláštním případem jsou také zájmena-klitika, která se v některých jazycích mohou nebo musí spojit se slovesem či dalšími slovními druhy (české "byls", "sis", "tys", "žes"; španělské "despiértate", "despertarse", "démelo"). V arabštině je podobný problém mnohem větších rozměrů, protože se tam běžně lepí malá slova k velkým (např. spojka "wa", člen "al" aj.) | * Vymyslet koncepci pro stažené (contracted) tvary, kde se do jednoho slova dostaly dva různé slovní druhy. Zatím to na různých místech řeším různě. Patří sem české "proň", "bylť", německé "zum" a nejspíš další jevy v dalších jazycích. Zvláštním případem jsou také zájmena-klitika, která se v některých jazycích mohou nebo musí spojit se slovesem či dalšími slovními druhy (české "byls", "sis", "tys", "žes"; španělské "despiértate", "despertarse", "démelo"). V arabštině je podobný problém mnohem větších rozměrů, protože se tam běžně lepí malá slova k velkým (např. spojka "wa", člen "al" aj.) |
| |
Things to think about (not sure that these changes should really be made): | ==== Things to think about (not sure that these changes should really be made): ==== |
| |
* Sloučit vlastnosti ''verbform'' a ''mood''? V současnosti (29.3.2008) se ''mood'' vyskytuje v ar::conll, bg::conll, cs::pdt, da::conll, de::stts, sv::hajic a sadách z nich odvozených. Všude se vyskytuje pouze u určitých sloves (''verbform = fin''), pouze u sv::hajic se vyskytuje ještě u supina, ale tam je stejně uveden indikativ a nic se tím nerozlišuje. Na druhou stranu to, že máme způsob (mood) oddělený, umožňuje nejen říkat tomu správně způsob, ale také nastavit obecné finitní sloveso při dekódování sad značek, které způsob nezachycují. Otázka je, jestli v takovém případě není vždy způsob oznamovací. Divně by to mohlo vypadat v jazycích, kde se způsob tvoří výhradně analyticky, pokud takové jsou. Pokud tyto rysy zůstanou oddělené, mohli zavést nový test (jehož výsledkem by nebyla chyba, ale jen varování), který by hlídal, že když je nastaven způsob, je slovesný tvar nastaven na ''fin''. | * Sloučit vlastnosti ''verbform'' a ''mood''? V současnosti (29.3.2008) se ''mood'' vyskytuje v ar::conll, bg::conll, cs::pdt, da::conll, de::stts, sv::hajic a sadách z nich odvozených. Všude se vyskytuje pouze u určitých sloves (''verbform = fin''), pouze u sv::hajic se vyskytuje ještě u supina, ale tam je stejně uveden indikativ a nic se tím nerozlišuje. Na druhou stranu to, že máme způsob (mood) oddělený, umožňuje nejen říkat tomu správně způsob, ale také nastavit obecné finitní sloveso při dekódování sad značek, které způsob nezachycují. Otázka je, jestli v takovém případě není vždy způsob oznamovací. Divně by to mohlo vypadat v jazycích, kde se způsob tvoří výhradně analyticky, pokud takové jsou. Pokud tyto rysy zůstanou oddělené, mohli zavést nový test (jehož výsledkem by nebyla chyba, ale jen varování), který by hlídal, že když je nastaven způsob, je slovesný tvar nastaven na ''fin''. |