[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
external:pcedt:tfa [2013/01/30 17:01]
ufal
external:pcedt:tfa [2013/04/29 14:18] (current)
ufal
Line 38: Line 38:
 **f** - nastaví ''tfa=f'' u aktuálního uzlu **f** - nastaví ''tfa=f'' u aktuálního uzlu
  
-**T (Shift + t)** - nastaví ''tfa=t'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány) +**T (Shift + t)** - nastaví ''tfa=t'' u aktuálního uzlu a celého jeho podstromu (uzly, které už ''tfa'' mají nastaveno či ''tfa'' nastaveno mít nemají, jsou vynechány) 
-**C (Shift + c)** - nastaví ''tfa=c'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány) +**C (Shift + c)** - nastaví ''tfa=c'' u aktuálního uzlu a celého jeho podstromu (uzly, které už ''tfa'' mají nastaveno či ''tfa'' nastaveno mít nemají, jsou vynechány) 
-**F (Shift + f)** - nastaví ''tfa=f'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány)+**F (Shift + f)** - nastaví ''tfa=f'' u aktuálního uzlu a celého jeho podstromu (uzly, které už ''tfa'' mají nastaveno či ''tfa'' nastaveno mít nemají, jsou vynechány) 
 + 
 +**Ctrl + t** - nastaví ''tfa=t'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány) 
 +**Ctrl + c** - nastaví ''tfa=c'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány) 
 +**Ctrl + f** - nastaví ''tfa=f'' u aktuálního uzlu a celého jeho podstromu (uzly, které ''tfa'' nastaveno mít nemají, jsou vynechány)
  
 **!** - zobrazí dialog pro vložení typované anotátorské poznámky k aktuálnímu uzlu; jedním z typů je ''TFA'', ale je možno použít i ostatní typy; uzly s anotátorskou poznámkou typu ''TFA'' jsou označeny modrým nápisem ''TFA''. **!** - zobrazí dialog pro vložení typované anotátorské poznámky k aktuálnímu uzlu; jedním z typů je ''TFA'', ale je možno použít i ostatní typy; uzly s anotátorskou poznámkou typu ''TFA'' jsou označeny modrým nápisem ''TFA''.
Line 52: Line 56:
  
 **Ctrl + šipka vlevo či vpravo** - posun aktuálního uzlu v hloubkovém uspořádání doleva či doprava **Ctrl + šipka vlevo či vpravo** - posun aktuálního uzlu v hloubkovém uspořádání doleva či doprava
-**Alt + šipka vlevo či vpravo** - posun aktuálního uzlu a celého jeho podstromu v hloubkovém uspořádání doleva či doprava+**Alt + šipka vlevo či vpravo** - posun aktuálního uzlu a celého jeho podstromu v hloubkovém uspořádání doleva či doprava (přeskakuje celé podstromy (jejich projektivní části)) 
 +**Ctrl + n, m** - posun aktuálního uzlu a celého jeho podstromu v hloubkovém uspořádání doleva či doprava (o jeden uzel)
  
 **Ctrl + šipka nahoru či dolů** - přechod na předchozí či následující strom v souboru **Ctrl + šipka nahoru či dolů** - přechod na předchozí či následující strom v souboru
Line 59: Line 64:
  
 ==== Automatické úpravy ==== ==== Automatické úpravy ====
-=== Přerovnání synů uzlu s gram/sempos="n" === +=== Přerovnání synů všech uzlů === 
-Kdykoliv jsou všechny tfa-relevantní synové uzlu ''gram/sempos="n"'' označeny hodnotami ''tfa'', dojde k automatickému přerovnání těchto synů (a jejich podstromů) tak, aby všechny tyto uzly s ''tfa="f"'' byly napravo od svého otce a všechny tyto uzly s ''tfa="t"'' nebo ''"c"' byly nalevo od svého otce. Upraví se i pořadí synů mezi sebou: u uzlů s hodnotou ''tfa="f"'' budou uzly s funktorem ''DPHR'' či ''CPHR'' jako první, uzly s funktorem ''ID'' jako druhé; všechny ostatní budou v původním pořadí za nimi a anotátor jim musí věnovat pozornost (u hodnot ''"t"'' a ''"c"'' je pořadí opačné).+Kdykoliv jsou všichni tfa-relevantní synové nějakého uzlu, který nemá ''nodetype="coap"'' (s výjimkou společných rozvití, viz níže), označeni hodnotami ''tfa'', dojde k automatickému přerovnání těchto synů (a jejich podstromů) tak, aby všechny tyto uzly s ''tfa="f"'' byly napravo od svého otce a všechny tyto uzly s ''tfa="t"'' nebo ''"c"'' byly nalevo od svého otce. Výjimky z tohoto pravidla je potřeba kontrolovat ručně. Synové s ''nodetype="coap"'' jsou automaticky přeřazováni ve chvíli, kdy všichni ''member'' synové tohoto ''coap'' uzlu dostanou stejnou hodnotu atributu ''tfa'' (všichni ''"f"'' či všichni ''"t"/"c"''). 
 + 
 +=== Přerovnání synů uzlu s gram/sempos="n" (jmenné fráze) === 
 +U synů uzlu s gram/sempos="n" se upraví i pořadí synů mezi sebou: u uzlů s hodnotou ''tfa="f"'' budou uzly s funktorem ''DPHR'' či ''CPHR'' jako první, uzly s funktorem ''ID'' jako druhé; všechny ostatní budou v původním pořadí za nimi a anotátor jim musí věnovat pozornost (u hodnot ''"t"'' a ''"c"'' je pořadí opačné). 
 + 
 +=== Přerovnání synů uzlu s gram/sempos="v" (slovesné fráze) === 
 +U synů uzlu s gram/sempos="v" se rovněž upraví i pořadí synů s hodnotou ''tfa="t"'' nebo ''"c"'' mezi sebou: 
 +První budou uzly ''VOCAT'', pak ''PREC'', pak ''ATT''; první zprava (avšak vlevo od otce) budou místní či časové funktory, pak ''#PersPron'', pak generované uzly; ostatní typy uzlů budou uprostřed mezi nimi a je potřeba je seřadit ručně. 
 +Výjimkou z výše uvedeného jsou v případě otce s (již vyplněnou) hodnotou ''tfa="f"'' uzly ''RHEM'' rovněž s hodnotou ''tfa="f"'', které nemají t_lemma="#Neg". Ty jsou řazeny vlevo od otce, co nejblíže k němu.  
 + 
 +=== Přerovnání společných rozvití v koordinacích === 
 +Kdykoliv jsou všichni tfa-relevantní synové nějakého uzlu s ''nodetype="coap"'', kteří nejsou členové koordinace (nemají ''is_member="1"''),  označeni hodnotami ''tfa'', dojde k jejich přesunutí úplně doleva či doprava podle jejich hodnoty ''tfa''
 + 
 +==== Automatická předanotace ==== 
 +Externí skript, který předanotuje data. Předanotace probíhá postupně v následujících krocích (už jednou anotovaný uzel se nepřeanotovává): 
 + 
 + - Generované uzly, které nemají analytický protějšek (tj. nejsou to kopírované uzly) a které navíc nejsou ''RHEM'' ani ''#Forn'', dostávají automaticky hodnotu ''tfa="t"'' (očekávaná chybovost: 0). 
 + - Generované uzly, které jsou členy koordinace/apozice a mají analytický protějšek (není to tedy např. ''#Forn''), dostávají automaticky hodnotu ''tfa="t"'' (očekávaná chybovost: 0). 
 + - Uzly, ze kterých vede gramatická, textová či segmentová koreference, dostávají automaticky hodnotu ''tfa="t"'' (očekávaná chybovost: 1:100). 
 + - Uzly ''PRED'', které nejsou generované a jejichž ''t_lemma'' se nenachází v předchozí větě, dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: 1:40). 
 + - Generované uzly ''PRED'' dostávají automaticky hodnotu ''tfa="t"'' (očekávaná chybovost: 1:100) 
 + - Ostatní slovesné uzly (''gram/sempos="v"''), které mají jako ''funktor'' jednu z hodnot ''(ADDR|AIM|CAUS|ACMP|MANN|PAT|EFF|AUTH|BEN|COMPL|EXT|ORIG|RESL|TFHL|TSIN)'', dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: maximálně 1:10). 
 + - Uzly, které mají jako ''funktor'' jednu z hodnot ''(PARTL|DENOM|MOD|EXT)'', dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: maximálně 1:10). 
 + - Uzly, které mají jako ''funktor'' hodnotu ''RHEM'' a nejsou na první pozici ve větě, dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: 1:10). 
 + - Uzly s ''t_lemma="tady"'' dostávají automaticky hodnotu ''tfa="t"'' (očekávaná chybovost: 1:10). 
 + - Pro zhruba 5 tisíc prvních vět, které jsou v plánu anotace: uzly, které jsou českými protějšky anglických uzlů, které na povrchu stojí za slovesem a mají u sebe neurčitý člen, dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: neznámá). 
 + 
 +Další kroky probíhají až po tom, co jsou předchozí kroky aplikovány na všechny uzly stromu: 
 + 
 + - Synové slovesa, které má ''tfa="f"'' a které ve své klauzi není na první či druhé pozici, pokud stojí v povrchovém slovosledu za tímto slovesem, dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: neznámá). 
 + - RSTR synové uzlů, které mají ''tfa="f"'', dostávají automaticky hodnotu ''tfa="f"'' (očekávaná chybovost: 1:30).

[ Back to the navigation ] [ Back to the content ]