Both sides previous revision
Previous revision
|
Next revision
Both sides next revision
|
user:zeman:interset:to-do [2008/03/29 20:13] zeman Remove pos = inf, make it a particle. |
user:zeman:interset:to-do [2008/03/29 22:18] zeman I am not sure whether mood should be merged with verbform. |
===== Features and values ===== | ===== Features and values ===== |
| |
* Sloučit vlastnosti verbform a mood. | |
* Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). | * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). |
* Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature. | * Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature. |
Things to think about (not sure that these changes should really be made): | Things to think about (not sure that these changes should really be made): |
| |
| * Sloučit vlastnosti ''verbform'' a ''mood''? V současnosti (29.3.2008) se ''mood'' vyskytuje v ar::conll, bg::conll, cs::pdt, da::conll, de::stts, sv::hajic a sadách z nich odvozených. Všude se vyskytuje pouze u určitých sloves (''verbform = fin''), pouze u sv::hajic se vyskytuje ještě u supina, ale tam je stejně uveden indikativ a nic se tím nerozlišuje. Na druhou stranu to, že máme způsob (mood) oddělený, umožňuje nejen říkat tomu správně způsob, ale také nastavit obecné finitní sloveso při dekódování sad značek, které způsob nezachycují. |
* Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy. | * Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy. |
* Pokud se osvědčí nové třídění zájmen, posvítit si i na číslovky. Některé přesunout k zájmenům ("kolik", "kolikátý"), jiné jako zvláštní podkategorie podstatných jmen ("čtvrtina", "sedmero"), přídavných jmen ("čtvrtý", "dvojí") a příslovcí ("čtyřikrát", "poprvé"). | * Pokud se osvědčí nové třídění zájmen, posvítit si i na číslovky. Některé přesunout k zájmenům ("kolik", "kolikátý"), jiné jako zvláštní podkategorie podstatných jmen ("čtvrtina", "sedmero"), přídavných jmen ("čtvrtý", "dvojí") a příslovcí ("čtyřikrát", "poprvé"). |