Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
user:majlis:hadoop:sge [2011/11/01 16:16] majlis vytvořeno |
user:majlis:hadoop:sge [2011/11/09 11:46] (current) majlis |
||
---|---|---|---|
Line 4: | Line 4: | ||
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
+ | |||
+ | ===== Srovnani SGE vs Hadoop ===== | ||
+ | |||
+ | MapReduce ja zalozen na principu minimalizace sdilenych zdroju + vyuziti levneho HW, proto kazdy node v clusteru ma svoje vlastni disky ([[http:// | ||
+ | |||
+ | ==== Organizace ulozne kapacity ==== | ||
+ | |||
+ | Hadoop pristup: X GB soubor se nakopiruje do HDFS -> sam rozdeli se na casti a rozdistribuuje se po jednotlivych nodech -> na kazdem se zpracuje ta cast dat, ktera tam lezi -> vysledek | ||
+ | Nas pristup: nevim, jak je to zorganizovane u nas - ale rozhodne se musi " | ||
+ | |||
+ | TODO: zjistit, jak je to zorganizovane u nas | ||
+ | === Vyhoda Hadoopu === | ||
+ | * da se spustit mnohem vice uloh nad 1 daty | ||
+ | * melo by to byt rychlejsi - data se ctou z lokalniho disku a ne z nejakeho diskoveho pole | ||
+ | * melo by to byt levnejsi - neni potreba zadne sofistikovane diskove pole a staci jen hloupe HDD | ||
+ | === Nevyhoda Hadoopu === | ||
+ | - vyzaduje aby kazdy node mel samostatny (dostatecne velky) disk - v soucasne dobe maji nody v clusteru jen 56GB | ||
+ | - bez toho to asi nebude moc fungovat | ||
+ | |||
+ | |||
+ | ==== Redundance dat ==== | ||
+ | |||
+ | Protoze Hadoop predpoklada, | ||
+ | |||
+ | V clanku z roku [[http:// | ||
+ | |||
+ | ==== Distribuce uloh ==== | ||
+ | |||
+ | Uloha, ktera: | ||
+ | - cte ze vstupu nazvy souboru | ||
+ | - na kazdem z nich provede nejakou operaci | ||
+ | - vysledek ulozi do nejakeho jineho souboru | ||
+ | - na vystup vypise nazvy novych souboru | ||
+ | Je podle mne " | ||
+ | |||
+ | Pak existuje pokrocila sprava prav uzivatelu - uzivatel X muze spustit maximalne Y uloh (a dalsi) - ktere nevim, jestli na Hadoopu jdou udelat, ale u nas taky nefungujou => asi by to moc nevadilo. | ||