Přiřazování syntaktických značek

Primitivní program, který se učí přiřazovat syntaktické značky (též analytické funkce, druhy závislostí) na základě morfologických značek rodiče a dítěte. Případné chyby v přiřazení rodičů k dětem (chyby parseru) se nutně promítnou do i do úspěšnosti tohoto programu.

Trénování:

atrain.pl < train.csts > model.astat

Čte strukturu z <g>, morfologické značky z <t> a syntaktické značky z <A>.

Přiřazování:

aclass.pl -m model.astat -z mdgdz < test.csts > test.a.csts

Volba -z (–zdroj) mdgdz programu řekne, že má číst strukturu z <MDg src=“dz”>. Není-li tato volba použita, čte se z <g>.

Upravil jsem aclass.pl tak, aby v případě, že nenajde neprázdnou syntaktickou značku pro dvojici morfologických značek rodiče a dítěte, zkusil najít syntaktickou značku pouze pro morfologickou značku dítěte. Pokud se ani to nepovede, vezme nejčastější syntaktickou značku. Úspěšnost značkování zřetelně vzrostla, dosud se totiž často stávalo, že syntaktické značky byly prázdné. Klesla také závislost úspěšnosti syntaktického značkování na úspěšnosti parsingu.