[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
user:zeman:interset:to-do [2008/03/29 22:18]
zeman I am not sure whether mood should be merged with verbform.
user:zeman:interset:to-do [2008/03/29 23:05]
zeman subpos=sent moved to punctype=root
Line 11: Line 11:
 ===== Features and values ===== ===== Features and values =====
  
-  * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). 
-  * Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature. 
   * Zrušit ''pos = inf''. Udělat z toho pouze jeden z druhů částic.   * Zrušit ''pos = inf''. Udělat z toho pouze jeden z druhů částic.
   * Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat.   * Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat.
Line 26: Line 24:
 Things to think about (not sure that these changes should really be made): Things to think about (not sure that these changes should really be made):
  
-  * Sloučit vlastnosti ''verbform'' a ''mood''? V současnosti (29.3.2008) se ''mood'' vyskytuje v ar::conll, bg::conll, cs::pdt, da::conll, de::stts, sv::hajic a sadách z nich odvozených. Všude se vyskytuje pouze u určitých sloves (''verbform = fin''), pouze u sv::hajic se vyskytuje ještě u supina, ale tam je stejně uveden indikativ a nic se tím nerozlišuje. Na druhou stranu to, že máme způsob (mood) oddělený, umožňuje nejen říkat tomu správně způsob, ale také nastavit obecné finitní sloveso při dekódování sad značek, které způsob nezachycují.+  * Sloučit vlastnosti ''verbform'' a ''mood''? V současnosti (29.3.2008) se ''mood'' vyskytuje v ar::conll, bg::conll, cs::pdt, da::conll, de::stts, sv::hajic a sadách z nich odvozených. Všude se vyskytuje pouze u určitých sloves (''verbform = fin''), pouze u sv::hajic se vyskytuje ještě u supina, ale tam je stejně uveden indikativ a nic se tím nerozlišuje. Na druhou stranu to, že máme způsob (mood) oddělený, umožňuje nejen říkat tomu správně způsob, ale také nastavit obecné finitní sloveso při dekódování sad značek, které způsob nezachycují. Otázka je, jestli v takovém případě není vždy způsob oznamovací. Divně by to mohlo vypadat v jazycích, kde se způsob tvoří výhradně analyticky, pokud takové jsou. Pokud tyto rysy zůstanou oddělené, mohli zavést nový test (jehož výsledkem by nebyla chyba, ale jen varování), který by hlídal, že když je nastaven způsob, je slovesný tvar nastaven na ''fin''.
   * Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy.   * Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy.
   * Pokud se osvědčí nové třídění zájmen, posvítit si i na číslovky. Některé přesunout k zájmenům ("kolik", "kolikátý"), jiné jako zvláštní podkategorie podstatných jmen ("čtvrtina", "sedmero"), přídavných jmen ("čtvrtý", "dvojí") a příslovcí ("čtyřikrát", "poprvé").   * Pokud se osvědčí nové třídění zájmen, posvítit si i na číslovky. Některé přesunout k zájmenům ("kolik", "kolikátý"), jiné jako zvláštní podkategorie podstatných jmen ("čtvrtina", "sedmero"), přídavných jmen ("čtvrtý", "dvojí") a příslovcí ("čtyřikrát", "poprvé").
   * Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.)   * Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.)
   * Přejmenovat number = plu na plur?    * Přejmenovat number = plu na plur?
 +  * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek v cs::pdt (a odvozeném cs::conll; nikde jinde). Místo toho by se ale dalo využít ''variant = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). **Problém:** jak vokalizované, tak nevokalizované předložky se také vyskytují s ''variant = 1''. Nemůžu do jednoho rysu nacpat současně ''long'' a ''1'', a nemůžu ani říct, že z ''1'' taky plyne vokalizovanost.
  
 ===== Specific drivers ===== ===== Specific drivers =====

[ Back to the navigation ] [ Back to the content ]