Differences
This shows you the differences between two versions of the page.
Both sides previous revision
Previous revision
|
Next revision
Both sides next revision
|
padt:start [2013/06/24 12:55] zeman Upozornění na potenciální zdroj chyb. |
padt:start [2013/06/24 14:36] zeman Formát dat. |
| |
Soubor EAT/AFP_ARB_20000715.0033.syntax.pml, řádek 1409 až 1431. Jsou tu dva uzly (na sobě zavěšené) pro slovo p5w6. To slovo není na morfologické rovině rozdělené, takže pro dva uzly není důvod. Zatím jsem tomu závislému (a ve větě dříve ležícímu) uzlu upravil syntaktické ID, aby nebylo duplicitní. Nejradši bych celý uzel smazal, ale asi by to chtělo přečíslovat atributy ord v celé větě, aby tvořily souvislou posloupnost. | Soubor EAT/AFP_ARB_20000715.0033.syntax.pml, řádek 1409 až 1431. Jsou tu dva uzly (na sobě zavěšené) pro slovo p5w6. To slovo není na morfologické rovině rozdělené, takže pro dva uzly není důvod. Zatím jsem tomu závislému (a ve větě dříve ležícímu) uzlu upravil syntaktické ID, aby nebylo duplicitní. Nejradši bych celý uzel smazal, ale asi by to chtělo přečíslovat atributy ord v celé větě, aby tvořily souvislou posloupnost. |
| |
| ==== Atribut score ==== |
| |
| Odstranit. Podle Otova vyjádření jde zřejmě o nějaký dočasný nepořádek, který Ota zapomněl uklidit. |
| |
| ==== Formát dat ==== |
| |
| Hlavním formátem, ve kterém se bude PADT 2.0 distribuovat, by zřejmě měl být PML, tak jak ho Ota navrhnul (tři, popř. čtyři roviny). Můžeme zvážit, zda přibalit i Treex, ale asi to není nutné, treexový blok Read::PADT by měl bohatě stačit. Zato ale určitě uděláme spoustě lidí radost, když nabídneme ty podstatné informace vytažené ve formátu CoNLL 2006. To bychom měli udělat. |