Both sides previous revision
Previous revision
Next revision
|
Previous revision
Next revision
Both sides next revision
|
user:zeman:interset:to-do [2008/03/29 22:22] zeman |
user:zeman:interset:to-do [2008/03/29 23:05] zeman subpos=sent moved to punctype=root |
===== Features and values ===== | ===== Features and values ===== |
| |
* Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). | |
* Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature. | |
* Zrušit ''pos = inf''. Udělat z toho pouze jeden z druhů částic. | * Zrušit ''pos = inf''. Udělat z toho pouze jeden z druhů částic. |
* Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat. | * Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat. |
* Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.) | * Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.) |
* Přejmenovat number = plu na plur? | * Přejmenovat number = plu na plur? |
| * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek v cs::pdt (a odvozeném cs::conll; nikde jinde). Místo toho by se ale dalo využít ''variant = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). **Problém:** jak vokalizované, tak nevokalizované předložky se také vyskytují s ''variant = 1''. Nemůžu do jednoho rysu nacpat současně ''long'' a ''1'', a nemůžu ani říct, že z ''1'' taky plyne vokalizovanost. |
| |
===== Specific drivers ===== | ===== Specific drivers ===== |