Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
treex:coordinations [2015/03/14 19:48] popel created |
treex:coordinations [2015/10/17 21:53] (current) popel |
||
---|---|---|---|
Line 78: | Line 78: | ||
=== Motivace pro zvolené řešení společných rozvití === | === Motivace pro zvolené řešení společných rozvití === | ||
- | Společné rozvití je většinou těžké odlišit od privátního (cf. "Jan a Marie, kteří" | + | Společné rozvití je většinou těžké odlišit od privátního (cf. "Jan a Marie, kteří" |
Často nás rozdíl mezi společným a privátním rozvitím nezajímá a pražský styl nám to komplikuje, že takto jemná distinkce se odráží v celé topologii stromu. V tomto návrhu je snadné tu distinkci ignorovat. | Často nás rozdíl mezi společným a privátním rozvitím nezajímá a pražský styl nám to komplikuje, že takto jemná distinkce se odráží v celé topologii stromu. V tomto návrhu je snadné tu distinkci ignorovat. | ||
Line 95: | Line 95: | ||
* V UD jsou předložky a spojky " | * V UD jsou předložky a spojky " | ||
- | * Lze zařídit, aby treexové API " | + | * Lze zařídit, aby treexové API " |
+ | |||
+ | * Samozřejmě Read:: | ||
* Některé reprezentace koordinací mohou být výhodnější pro některé typy parserů. Bylo by jistě zajímavé to prozkoumat (jak plánujeme už několik let, a mezitím o tom vyšlo několik článků, ale žádný to ještě neprozkoumal tak důkladně, jak bych si představoval). Myslím si ale, že je chyba přizpůsobovat treexovou reprezentaci tomu, co umí současné parsery. Měli bychom se už konečně odpoutat od představy, že když je v treebanku nějaký jev reprezentován nějakým stylem, že to tak musíme dělat i při trénování parseru. | * Některé reprezentace koordinací mohou být výhodnější pro některé typy parserů. Bylo by jistě zajímavé to prozkoumat (jak plánujeme už několik let, a mezitím o tom vyšlo několik článků, ale žádný to ještě neprozkoumal tak důkladně, jak bych si představoval). Myslím si ale, že je chyba přizpůsobovat treexovou reprezentaci tomu, co umí současné parsery. Měli bychom se už konečně odpoutat od představy, že když je v treebanku nějaký jev reprezentován nějakým stylem, že to tak musíme dělat i při trénování parseru. | ||
Line 109: | Line 111: | ||
U normálních závislostí tento problém nenastává, | U normálních závislostí tento problém nenastává, | ||
- | Možná by šlo využít perlovských anotací proměnných (viz '' | + | Možná by šlo využít perlovských anotací proměnných (viz '' |
('' | ('' | ||
+ | |||
+ | |||
+ | ==== Vizualizace v TrEdu ==== | ||
+ | Pokud se TrEd nepoužívá k editaci, ale jen k prohlížení, | ||
+ | |||
+ | Primární mód by zobrazoval všechny koordinované uzly jako sourozence (v jedné rovině). U vnořených koordinací by tedy toto zobrazení vedlo k o něco širším (plošším, | ||
+ | |||
+ | < | ||
+ | <pre> | ||
+ | | ||
+ | / / | ||
+ | ---/ | ||
+ | | John Mary and Bob | | bed and breakfast | | ||
+ | --------------------- | ||
+ | </ | ||
+ | |||
+ | <span style=" | ||
+ | </ | ||
+ | |||
+ | Alternativní zobrazovací mód by byl podobný tomu současnému, | ||
+ | |||
+ | * Společné rozvití by viselo na prvním (primárním) rodiči a ostatní by byly jako secondary dependencies značeny čárkovanou hranou. (V současném zobrazení visí společné rozvití na spojce a je tedy na stejné rovině jako jeho rodiče, což mi odjakživa přišlo velmi matoucí. Toho se teď zbavíme.) | ||
+ | * Koordinační spojka by byla na stejné úrovni jako conjuncts. Takže conjuncts i koordinační spojka (čárka) by visely na umělém (přidaném) uzlu. | ||
+ | |||
+ | < | ||
+ | <pre> | ||
+ | love | ||
+ | / | ||
+ | # | ||
+ | / / | \ /| \ | ||
+ | / | ||
+ | John Mary and Bob bed and breakfast | ||
+ | |||
+ | |||
+ | # | ||
+ | / | \ | ||
+ | # | ||
+ | / | \ | ||
+ | Simon and Garfunkel | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||