Differences
This shows you the differences between two versions of the page.
mst [2006/11/06 09:29] |
mst [2006/11/06 09:29] (current) |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ===== Maximum Spanning Tree (MST) analytický parser ===== | ||
+ | __Spravuje: | ||
+ | __Originální McDonaldovo README:__ '' | ||
+ | __Popis technologie: | ||
+ | |||
+ | Existují různé možnosti spuštění. Dělí se podle použití: | ||
+ | - Mám '' | ||
+ | - Mám fůru '' | ||
+ | - Nechci se upínat na běžící server a spustím si to celé sám: Postup 3) | ||
+ | - Chci si natrénovat vlastní model: Postupuju podle 4) | ||
+ | - Nechci vyrábět '' | ||
+ | |||
+ | ==== 1) kapesní verze ==== | ||
+ | |||
+ | __Platforma: | ||
+ | __Dostupnost: | ||
+ | __Program pro spuštění: | ||
+ | |||
+ | __Postup:__ | ||
+ | - Mám soubor clanek.m | ||
+ | - Pustim parser: | ||
+ | < | ||
+ | |||
+ | __Poznámky: | ||
+ | Argument programu (zde '' | ||
+ | |||
+ | |||
+ | ==== 2) klientská verze ==== | ||
+ | |||
+ | __Platforma: | ||
+ | __Dostupnost: | ||
+ | __Program pro spuštění: | ||
+ | < | ||
+ | |||
+ | __Postup:__ | ||
+ | 1) Mám soubory '' | ||
+ | < | ||
+ | 2) Vytvorim adresar '' | ||
+ | < | ||
+ | 3) Pustim parser: | ||
+ | < | ||
+ | |||
+ | __Poznámky: | ||
+ | Tento způsob bude rychlejší než 1), protože se k serveru připojí jen jednou. Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. | ||
+ | |||
+ | ==== 3) parser s úpravou pro PML ==== | ||
+ | __Platforma: | ||
+ | __Dostupnost: | ||
+ | __Cesta:__ '' | ||
+ | __Použití: | ||
+ | __Poznámky: | ||
+ | |||
+ | Argumenty jsou stejné jako u způsobu 2) | ||
+ | |||
+ | 64-bitové stroje jsou potřeba kvůli velké paměťové náročnosti. Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. Samotné parsování probíhá velmi rychle, ale na začátku se nahrává model do paměti (cca. 6 min 30 s), proto je vhodné všechny soubory parsovat jedním spuštěním příkazu. Problémům se dá vyhnout použitím instantní verze parseru popsané výše. | ||
+ | |||
+ | Případné přetrénování je možné, ale zatím není implementováno jeho rozšíření o PML formát. | ||
+ | |||
+ | ==== 4) Originální parser ==== | ||
+ | __Platforma: | ||
+ | __Dostupnost: | ||
+ | __Originální McDonaldovo README:__ '' | ||
+ | __Cesta:__ '' | ||
+ | __Použití: | ||
+ | __Poznámky: | ||
+ | |||
+ | 64-bitové stroje jsou potřeba kvůli velké paměťové náročnosti. | ||
+ | |||
+ | Postupujte podle README | ||
+ | |||
+ | ==== 5) klientský parser bez PML ==== | ||
+ | |||
+ | __Platforma: | ||
+ | __Dostupnost: | ||
+ | __Program pro spuštění: | ||
+ | |||
+ | __Postup:__ | ||
+ | - Mám soubor clanek.mcd | ||
+ | - Pustim parser: | ||
+ | < | ||
+ | |||
+ | __Poznámky: | ||
+ | Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. | ||
+ | Formát vstupu a výstupu je podle McDonalda. Ukázkový vstup a výstup: | ||
+ | / | ||
+ | / | ||
+ | |||
+ | **Všechny znaky ve formách jsou malými písmeny a používá se dvouznakový tag.** | ||
+ | |||
+ | -- Václav Novák, 2.8.2006 |