[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Last revision Both sides next revision
format-conll [2009/02/26 15:57]
zeman Odkazy na jednotlivé ročníky CoNLL Shared Task.
format-conll [2009/02/26 17:41]
zeman Poznámka k PRED a APREDs.
Line 43: Line 43:
 | PRED | Rolesets of the semantic predicates in this sentence. This includes both nominal and verbal predicates. The split-form tokens that are not semantic predicates must be marked with “_”. We use the same roleset names as the PropBank and NomBank frames. | | PRED | Rolesets of the semantic predicates in this sentence. This includes both nominal and verbal predicates. The split-form tokens that are not semantic predicates must be marked with “_”. We use the same roleset names as the PropBank and NomBank frames. |
 | APREDs | Columns with argument labels for the each semantic predicate following textual order, i.e., the first column corresponds to the first predicate in PRED, the second column to the second predicate, etc. Note that, because this algorithm uniquely identifies the ID of the corresponding predicate, it is sufficient to store the label of the argument here. The argument labels for verbal predicates follow the PropBank conventions. Labels of arguments to nominal predicates use NomBank conventions. The differences between PropBank and NomBank labels are discussed here. | | APREDs | Columns with argument labels for the each semantic predicate following textual order, i.e., the first column corresponds to the first predicate in PRED, the second column to the second predicate, etc. Note that, because this algorithm uniquely identifies the ID of the corresponding predicate, it is sufficient to store the label of the argument here. The argument labels for verbal predicates follow the PropBank conventions. Labels of arguments to nominal predicates use NomBank conventions. The differences between PropBank and NomBank labels are discussed here. |
 +
 +Poznámka Dan: Z toho vysvětlení polí PRED a APREDs nejsem ani trochu moudrý a podezírám organizátory, že se tam možná upsali. Česká data obsahují v poli PRED často totéž co v poli LEMMA, ale občas je tam jakýsi identifikátor (např. "v-w3075f2"), který možná odkazuje do Vallexu. Sloupce APREDs zřejmě neodpovídají "to the first/second/etc. predicate in PRED", protože v PREDu je vždy nejvýše jeden predikát. Spíše odpovídají prvnímu/druhému/atd. argumentu predikátu v PRED. Pořadí argumentů zřejmě odpovídá povrchovému slovosledu, i když pak nechápu, jak je možné, se před vyplněnými poli mohou objevit nějaká nevyplněná (resp. vyplněná podtržítkem). Hodnotou pole jsou "labels" argumentů, v případě českých dat funktory. Zatím mi není vůbec jasné, proč se to dělá takhle složitě, proč nejsou hodnoty uložené přímo u uzlů (řádků) odpovídajících argumentům.
  
 ===== Převody z a do jiných formátů ===== ===== Převody z a do jiných formátů =====

[ Back to the navigation ] [ Back to the content ]