Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
grid [2008/03/26 13:27] zeman Příklad volání qsub.csh. |
grid [2008/10/20 15:02] novak |
||
---|---|---|---|
Line 4: | Line 4: | ||
* lrc.ufal.hide.ms.mff.cuni.cz: | * lrc.ufal.hide.ms.mff.cuni.cz: | ||
- | * fireball1 až 10 (na každém 4 procesory Intel Xeon 3 GHz, 16 GB paměti, Fedora 7) | + | * fireball1 až 10 (4xcore, 16 GB RAM, Fedora 7, 2 procesory Intel Xeon 3 GHz) |
- | * tauri1 až 10 (na každém 4 procesory Intel Xeon 3 GHz, 16 GB paměti, Fedora 7) | + | * tauri1 až 10 (4xcore, 16 GB RAM, Fedora 7, 2 procesory Intel Xeon 3 GHz) |
- | * orion1 až 10 (na každém 4 procesory Intel Xeon 2 GHz, 16 GB paměti, 12.9.2007 naplánovaná odstávka na reinstalaci) | + | * orion1 až 10 (4xcore, 16 GB RAM, Fedora 7, 2 procesory Intel Xeon 2 GHz) |
- | * sol1 až 10 (na každém 4 procesory AMD Opteron Dual Core 2 GHz, 16 GB paměti, 12.9.2007 naplánovaná odstávka na reinstalaci) | + | * sol1 až 13 (4xcore, 16 GB RAM, Fedora 7, 2 procesory AMD Opteron Dual Core 2 GHz) |
Frontovací systém umožňuje: | Frontovací systém umožňuje: | ||
Line 18: | Line 18: | ||
Jednou za život musíte provést [[Základní nastavení SGE]], abyste SGE mohli používat. | Jednou za život musíte provést [[Základní nastavení SGE]], abyste SGE mohli používat. | ||
+ | |||
Line 62: | Line 63: | ||
qsub -S /bin/bash | qsub -S /bin/bash | ||
# když chcete, aby skript běžel v bashi | # když chcete, aby skript běžel v bashi | ||
+ | qsub -V | ||
+ | # když chcete předat proměnné prostředí | ||
qdel all | qdel all | ||
# když chcete zrušit všechny své joby (rušit cizí nesmíte) | # když chcete zrušit všechny své joby (rušit cizí nesmíte) | ||
Line 68: | Line 71: | ||
** V.N.: "qdel all" mi nefunguje, nahradil jsem za:** | ** V.N.: "qdel all" mi nefunguje, nahradil jsem za:** | ||
qdel " | qdel " | ||
+ | |||
+ | |||
Line 82: | Line 87: | ||
* Uklízet po sobě lokální data, protože jinak si tam už nikdo nic užitečného nepustí. | * Uklízet po sobě lokální data, protože jinak si tam už nikdo nic užitečného nepustí. | ||
* Vyhnout se hodně divokému paralelnímu přístupu ke sdíleným diskům. NFS server to pak nepěkně zpomalí pro všechny. Distribuujte tedy i data. | * Vyhnout se hodně divokému paralelnímu přístupu ke sdíleným diskům. NFS server to pak nepěkně zpomalí pro všechny. Distribuujte tedy i data. | ||
+ | * Informovat SGE, kolik paměti úloha žere, aby na strojích nedošla paměť: < | ||
+ | |||
Víc pravidel není. | Víc pravidel není. | ||
+ | ===== Slušné chování ===== | ||
+ | |||
+ | Pokud chci spouštět úlohy, které poběží dlouhou dobu (hodiny, dny), nepustím je všechny najednou, aby cluster mohli využívat i ostatní. | ||
===== Triky a opentlení ===== | ===== Triky a opentlení ===== | ||
Line 182: | Line 192: | ||
fi | fi | ||
</ | </ | ||
+ | |||
+ | |||
+ | ===== Synchronizace úloh (v Perlu) ===== | ||
+ | |||
+ | Pokud chci paralelizovat část úlohy (zde '' | ||
+ | |||
+ | * Obalím svůj skript pro běh na gridu – vytvořím '' | ||
+ | < | ||
+ | #!/bin/bash | ||
+ | . / | ||
+ | |||
+ | qrsh -cwd -V -p -50 -l mf=5g -now no ' | ||
+ | </ | ||
+ | * Ve svém hlavním skriptu ho pak zavolám a posbírám výsledky: | ||
+ | < | ||
+ | use threads; | ||
+ | use threads:: | ||
+ | my @threads; | ||
+ | my @results; | ||
+ | share(@results); | ||
+ | for (@inputs) | ||
+ | my $t = async { | ||
+ | my $reader; my $writer; | ||
+ | my $pid = open2($reader, | ||
+ | die " | ||
+ | $writer-> | ||
+ | print $writer " | ||
+ | $writer-> | ||
+ | for (< | ||
+ | chomp; | ||
+ | { | ||
+ | lock @results; | ||
+ | push @results, $_; | ||
+ | } | ||
+ | } | ||
+ | waitpid $pid, 0; # Pockame s ukoncenim vlakna na ukonceni ulohy v gridu | ||
+ | return $? >> 8; # Pokusime se ziskat navratovou hodnotu (netestoval jsem) | ||
+ | }; | ||
+ | push @threads, $t; | ||
+ | } | ||
+ | for (@threads) | ||
+ | die "Child exited with non-zero exit code" if $_-> | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Poznámky: | ||
+ | * Pokud lze všechno předat parametry, nemusí se otevírat obousměrná roura a situace bude jednodušší | ||
+ | * Pokud '' | ||
+ | * Celý příklad je použit v Czengu od V.N. | ||
+ |