Differences
This shows you the differences between two versions of the page.
|
mst [2006/11/06 09:29] |
mst [2006/11/06 09:29] (current) |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| + | ===== Maximum Spanning Tree (MST) analytický parser ===== | ||
| + | __Spravuje: | ||
| + | __Originální McDonaldovo README:__ '' | ||
| + | __Popis technologie: | ||
| + | |||
| + | Existují různé možnosti spuštění. Dělí se podle použití: | ||
| + | - Mám '' | ||
| + | - Mám fůru '' | ||
| + | - Nechci se upínat na běžící server a spustím si to celé sám: Postup 3) | ||
| + | - Chci si natrénovat vlastní model: Postupuju podle 4) | ||
| + | - Nechci vyrábět '' | ||
| + | |||
| + | ==== 1) kapesní verze ==== | ||
| + | |||
| + | __Platforma: | ||
| + | __Dostupnost: | ||
| + | __Program pro spuštění: | ||
| + | |||
| + | __Postup:__ | ||
| + | - Mám soubor clanek.m | ||
| + | - Pustim parser: | ||
| + | < | ||
| + | |||
| + | __Poznámky: | ||
| + | Argument programu (zde '' | ||
| + | |||
| + | |||
| + | ==== 2) klientská verze ==== | ||
| + | |||
| + | __Platforma: | ||
| + | __Dostupnost: | ||
| + | __Program pro spuštění: | ||
| + | < | ||
| + | |||
| + | __Postup:__ | ||
| + | 1) Mám soubory '' | ||
| + | < | ||
| + | 2) Vytvorim adresar '' | ||
| + | < | ||
| + | 3) Pustim parser: | ||
| + | < | ||
| + | |||
| + | __Poznámky: | ||
| + | Tento způsob bude rychlejší než 1), protože se k serveru připojí jen jednou. Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. | ||
| + | |||
| + | ==== 3) parser s úpravou pro PML ==== | ||
| + | __Platforma: | ||
| + | __Dostupnost: | ||
| + | __Cesta:__ '' | ||
| + | __Použití: | ||
| + | __Poznámky: | ||
| + | |||
| + | Argumenty jsou stejné jako u způsobu 2) | ||
| + | |||
| + | 64-bitové stroje jsou potřeba kvůli velké paměťové náročnosti. Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. Samotné parsování probíhá velmi rychle, ale na začátku se nahrává model do paměti (cca. 6 min 30 s), proto je vhodné všechny soubory parsovat jedním spuštěním příkazu. Problémům se dá vyhnout použitím instantní verze parseru popsané výše. | ||
| + | |||
| + | Případné přetrénování je možné, ale zatím není implementováno jeho rozšíření o PML formát. | ||
| + | |||
| + | ==== 4) Originální parser ==== | ||
| + | __Platforma: | ||
| + | __Dostupnost: | ||
| + | __Originální McDonaldovo README:__ '' | ||
| + | __Cesta:__ '' | ||
| + | __Použití: | ||
| + | __Poznámky: | ||
| + | |||
| + | 64-bitové stroje jsou potřeba kvůli velké paměťové náročnosti. | ||
| + | |||
| + | Postupujte podle README | ||
| + | |||
| + | ==== 5) klientský parser bez PML ==== | ||
| + | |||
| + | __Platforma: | ||
| + | __Dostupnost: | ||
| + | __Program pro spuštění: | ||
| + | |||
| + | __Postup:__ | ||
| + | - Mám soubor clanek.mcd | ||
| + | - Pustim parser: | ||
| + | < | ||
| + | |||
| + | __Poznámky: | ||
| + | Parser je natrénován na všech datech PDT2.0 s automatickými značkami Jana Hajiče. | ||
| + | Formát vstupu a výstupu je podle McDonalda. Ukázkový vstup a výstup: | ||
| + | / | ||
| + | / | ||
| + | |||
| + | **Všechny znaky ve formách jsou malými písmeny a používá se dvouznakový tag.** | ||
| + | |||
| + | -- Václav Novák, 2.8.2006 | ||
