Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
user:zeman:rizeni-pokusu-pomoci-makefilu [2009/03/20 18:32] zeman Absolutní a relativní cesty. |
user:zeman:rizeni-pokusu-pomoci-makefilu [2009/03/26 08:55] zeman Rozměry pro kategorizaci souborů. |
||
---|---|---|---|
Line 40: | Line 40: | ||
Pokud oddělíme kopírování dat ze vzdálených složek do samostatného Makefilu a pokud v& | Pokud oddělíme kopírování dat ze vzdálených složek do samostatného Makefilu a pokud v& | ||
+ | |||
+ | ===== Rozměry ===== | ||
+ | |||
+ | Soubory, které při zpracování vznikají, lze rozdělit podle následujících kritérií. Kritéria je vhodné zohlednit ve jménech souborů nebo složek, aby bylo možné zpracovávat skupinu souborů se stejným kritériem pomocí jednoho pravidla. Bohužel je často obtížné navrhnout optimální rozmístění kritérií v& | ||
+ | |||
+ | * Fáze zpracování (train, trained-model, | ||
+ | * Jazyk | ||
+ | * Datová sada (dev vs. eval, popř. nějaká další, třeba out-of-domain data) | ||
+ | * Velikost trénovacích dat pro křivku učení | ||
+ | * Různá nastavení parseru a dalších nástrojů, různá předzpracování dat (např. převedení morfologických značek do sady PDT) | ||