[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:interset:to-do [2008/03/29 19:59]
zeman Feature subjobj removed.
user:zeman:interset:to-do [2008/03/29 20:07]
zeman Přeuspořádání.
Line 11: Line 11:
 ===== Features and values ===== ===== Features and values =====
  
 +  * Sloučit vlastnosti verbform a mood.
 +  * Ze subpos=clit udělat samostatnou vlastnost, aby se usnadnil dotaz, zda je zájmeno osobní.
 +  * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice).
 +  * Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature.
   * Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat.   * Udělat pořádek v zájmenech, determinátorech, tázacích příslovcích apod. U starších ovladačů jsem používal jiný přístup než u novějších (počínaje bulharštinou), mělo by se to sjednotit. Samostatný slovní druh zájmeno přestane existovat.
     * Přece jen přidat kategorie zájmen? Dánové mají: demonstrative, indefinite, interrogative/relative, personal, possessive, reciprocal. Zrušit podkategorie wh?     * Přece jen přidat kategorie zájmen? Dánové mají: demonstrative, indefinite, interrogative/relative, personal, possessive, reciprocal. Zrušit podkategorie wh?
     * Členy a zájmena by se možná vůbec měly rozlišit jinak. Na nejvyšší úrovni by se rozlišovala substantivnost/atributivnost, pak teprve zda to má být raději člen nebo zájmeno. Případně osobní a přivlastňovací zájmena by mohla být zvlášť už na nejvyšší úrovni, protože ta se s žádnými členy plést nebudou.     * Členy a zájmena by se možná vůbec měly rozlišit jinak. Na nejvyšší úrovni by se rozlišovala substantivnost/atributivnost, pak teprve zda to má být raději člen nebo zájmeno. Případně osobní a přivlastňovací zájmena by mohla být zvlášť už na nejvyšší úrovni, protože ta se s žádnými členy plést nebudou.
-  * Sloučit vlastnosti verbform a mood. 
-  * Ze subpos=clit udělat samostatnou vlastnost, aby se usnadnil dotaz, zda je zájmeno osobní. 
-  * Udělat přehled častých prvků, které nemají vlastní slovní druh. Např. jak se řeší částice označující infinitiv. 
   * Jemněji roztřídit interpunkci. Dánové mají vlastní interpunkci, potom symboly (+, $), potom podivnosti, které my ani za interpunkci nepovažujeme. "U-21".   * Jemněji roztřídit interpunkci. Dánové mají vlastní interpunkci, potom symboly (+, $), potom podivnosti, které my ani za interpunkci nepovažujeme. "U-21".
-  * Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy. 
   * Classification of coordinative conjunctions: copulative, adversative etc. Example: sv::mamba.   * Classification of coordinative conjunctions: copulative, adversative etc. Example: sv::mamba.
 +  * Udělat přehled častých prvků, které nemají vlastní slovní druh. Např. jak se řeší částice označující infinitiv.
   * Projít jednotlivé sady a udělat jakýsi globální přehled třídění malých slovních druhů, zejména částic, předložek a spojek, možná samostatně i interpunkce. (Teď nemluvíme o zájmenech a členech, ty jsou samostatnou kapitolou.)   * Projít jednotlivé sady a udělat jakýsi globální přehled třídění malých slovních druhů, zejména částic, předložek a spojek, možná samostatně i interpunkce. (Teď nemluvíme o zájmenech a členech, ty jsou samostatnou kapitolou.)
-  * Zrušit ''subpos = voc''. Zatím se používá pro vokalizované tvary českých předložek. Místo toho by se ale dalo využít ''var = long''. U tříd předložek to teď narušuje členění na předložky, záložky a "okololožky" (cirkumpozice). 
   * Vymyslet koncepci pro stažené (contracted) tvary, kde se do jednoho slova dostaly dva různé slovní druhy. Zatím to na různých místech řeším různě. Patří sem české "proň", "bylť", německé "zum" a nejspíš další jevy v dalších jazycích. V arabštině je podobný problém mnohem větších rozměrů, protože se tam běžně lepí malá slova k velkým (např. spojka "wa", člen "al" aj.)   * Vymyslet koncepci pro stažené (contracted) tvary, kde se do jednoho slova dostaly dva různé slovní druhy. Zatím to na různých místech řeším různě. Patří sem české "proň", "bylť", německé "zum" a nejspíš další jevy v dalších jazycích. V arabštině je podobný problém mnohem větších rozměrů, protože se tam běžně lepí malá slova k velkým (např. spojka "wa", člen "al" aj.)
-  * Subpos ''sent'' (special case of punctuation in Prague Dependency Treebank) should be moved to the ''punctype'' feature. 
  
 Things to think about (not sure that these changes should really be made): Things to think about (not sure that these changes should really be made):
  
 +  * Příčestí by mělo mít vlastní slovní druh. S tím, že některé sady ho řadí pod sloveso a jiné pod přídavné jméno, jsou jenom problémy.
 +  * Pokud se osvědčí nové třídění zájmen, posvítit si i na číslovky. Některé přesunout k zájmenům ("kolik", "kolikátý"), jiné jako zvláštní podkategorie podstatných jmen ("čtvrtina", "sedmero"), přídavných jmen ("čtvrtý", "dvojí") a příslovcí ("čtyřikrát", "poprvé").
   * Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.)   * Předělat binární vlastnosti na hodnoty "yes" a "no". Nebo "1" a "0"? Nebo "1" a ""? (Tohle by se na rozdíl od "yes" a "no" alespoň lépe používalo v Perlu.)
   * Přejmenovat number = plu na plur?    * Přejmenovat number = plu na plur?

[ Back to the navigation ] [ Back to the content ]