\"/
\"/ \"/    

Centrum CERIT-SC po roce příprav

Luděk Matyska, David Antoš, ÚVT MU
Ročník XXI - číslo 3, únor 2011
Citace: L. Matyska, D. Antoš. Centrum CERIT-SC po roce příprav. Zpravodaj ÚVT MU. ISSN 1212-0901, 2011, roč. XXI, č. 3, s. 5-7.
verze pro tisk: PDF
Tematické zařazení: Dění na MU, Služby pro uživatele MU, Superpočítače a gridy
 předchozí článek | následující článek 
Uplynul již téměř rok, co byl představen záměr vybudovat na MU superpočítačové centrum CERIT-SC [1]. Původní velký projekt CERIT nebyl MŠMT v předloženém rozsahu akceptován, využili jsme nicméně dalších možností operačního programu VaVpI a podali samostatný projekt modifikovaného Centra CERIT-SC v rámci e-Infrastrukturní výzvy 3. osy operačního programu. Tento návrh úspěšně prošel hodnocením a je v současné době ve druhé fázi negociací. Zahájení realizace projektu očekáváme k 1. červenci 2011, projekt má trvat do konce roku 2013 a představuje první fázi vytvoření centra.

Proti původní myšlence vybudovat plnohodnotné superpočítačové centrum se záměr posunul do "odlehčené" varianty, postavené na vysoce flexibilních službách. Jejich vyšší přidaná hodnota je dána inovativními přístupy a pokročilými službami, nikoliv pouze "těžkou technikou".

Základní koncepce Centra CERIT-SC1 zůstává zachována a je postavena na velmi úzké spolupráci s aplikačními skupinami. Vlastní zpřístupnění výpočetních a úložných kapacit centra bude tvořit jen základ takovéto spolupráce, která bude především zaměřena do výzkumu a vývoje prováděného společně s uživateli, jak formou krátkodobé spolupráce nad konkrétním problémem, tak zejména dlouhodobých projektů.

1  Proč a pro koho to vlastně děláme

CERIT-SC bude dále rozvíjet odborné zázemí ÚVT a FI v oblasti paralelních a distribuovaných systémů s velkým důrazem na praktické uplatnění v práci svých uživatelů a partnerů.

V nejbližších letech, zejména s rozvojem nových aktivit v rámci projektů OP VaVpI, dojde k výraznému (mnohařádovému) růstu objemu experimentálních dat, která budou nové digitalizované přístroje produkovat (např. moderní genomické sekvenátory jsou schopny naměřit data v objemu jednotek TB v rámci jediného experimentu). K ukládání, zpřístupnění a zejména následnému zpracování těchto dat často nebude možné využít metody a systémy, které jsou používány v současnosti. Mění se rovněž výpočetní prostředí, kde bude pokračovat růst počtu jader v jednotlivých procesorech, které navíc bude možné relativně snadno spojovat do víceprocesorových počítačů.

Bude třeba vyvinout nové nebo modifikovat stávající algoritmy, aby efektivně využívaly toto mnohojaderné prostředí, již nějakou dobu není možné se spoléhat pouze na absolutní zvýšení výkonu jednotlivých procesorů. Práci takovýchto systémů bude rovněž třeba lépe plánovat, často důvěrný charakter studovaných dat si dále vyžádá nové přístupy k zabezpečení, autentizaci uživatelů a zejména řízení přístupu k datům, výpočtům i jejich výsledkům. Využití potenciálu takového prostředí nebude možné bez úzké spolupráce mezi informatiky a odborníky z aplikačních oblastí, včetně dopadu do výuky na obou stranách. Odborníci centra budou společně s uživateli zkvalitňovat stávající postupy a nástroje a vyvíjet nové algoritmy, programy, formy a způsoby využití výpočetního prostředí či úložných kapacit, nezávisle na tom, zda se jedná o zdroje centra, nebo vlastní zdroje uživatelů. Samostatně se centrum bude zabývat i výzkumem v oblasti flexibilních e-Infrastruktur, kam patří zejména otázky plánování, virtualizace, bezpečnosti a řízení přístupu.

2  Technické vybavení

"Odlehčená" forma centra samozřejmě neznamená, že by centrum CERIT-SC nedisponovalo výkonnou výpočetní technikou a dostatečnými úložnými kapacitami. Výpočetní kapacity centra budou postaveny na clusterovém řešení, a to ve dvou variantách, SMP a HD clustery. Oba typu clusterů jsou tvořeny v podstatě samostatnými počítači (uzly), které se ale u obou variant liší zejména v počtu procesorů a velikosti operační paměti.

Uzly HD ("High Density") clusterů obsahují menší počet jader (zpravidla 8-16) a disponují vnitřní pamětí kolem 16-32 GB. V případě SMP ("Symmetric MultiProcessing") clusterů mají uzly alespoň 64 (a spíše i více) jader a disponují vnitřní pamětí 128-256 GB. Uzly obou druhů clusterů jsou propojeny vysokorychlostní sítí (Infiniband), v současné době dosahující přenosové rychlosti 40 Gbps, s nižším zpožděním než Ethernet. Některé uzly (zejména HD clusterů) mohou být vybaveny i vhodnými akcelerátory, např. vysoce výkonnými grafickými kartami. Kombinace obou typů clusterů umožní v rámci centra uspokojit prakticky všechny uživatelské požadavky, s výjimkou těch, které vyžadují nasazení specializovaných superpočítačů.

3  Flexibilní přístup

Hlavní přidaná hodnota však nespočívá v samotném absolutním výpočetním výkonu, ale ve formě, kterou bude poskytován. Výpočetní infrastruktura bude virtualizována, což umožní ji poskytovat ve vysoce flexibilním režimu "na okamžitou žádost". Technická realizace centra (založená na kombinaci virtualizace, cloud rozhraní a vhodných plánovacích systémů) umožní pružně reagovat zejména na nečekané a často nepredikovatelné potřeby uživatelů. Zdroje centra budou přístupné bez složitého systému schvalování projektů a apriorní alokace zdrojů, jako je obvyklé v superpočítačových centrech. Uživatel požadavky na výpočetní prostředí (typ uzlů, parametry propojení, paměť atd.) deklaruje teprve při zadání úlohy. Zdroje CERIT-SC budou poskytovány kombinací přístupů best-effort a krátkodobé prioritizace (postavené i na minulých výsledcích, dosažených ve spolupráci s centrem), uživatelé tak budou mít vysokou šanci okamžitého uspokojení urgentních požadavků na výkon.

Tento přístup se samozřejmě nehodí pro uživatele, kteří mají jasné dlouhodobé požadavky na výpočetní kapacitu, zejména pokud požadují garanci, že tuto kapacitu budou mít k dispozici. Takoví uživatelé mohou využít alokaci v rámci zdrojů superpočítačového centra IT4Innovations v Ostravě, případě ji uspokojí vlastními kapacitami.

Souběžně s výpočetními kapacitami bude centrum pořizovat i služby ukládání dat. Centrum bude disponovat velkoobjemovým úložným systémem s kapacitou alespoň 2,5 PB (2500 TB), celkové přímo dostupné kapacity centra přesáhnou 1 PB. Veškerá tato kapacita bude integrována do virtualizovaného flexibilního prostředí.

Zdroje centra budou zapojeny do národního gridu a jeho prostřednictvím i do mezinárodní gridové infrastruktury, případně dalších systémů distribuované infrastruktury, které budou využívány v rámci velkých mezinárodních projektů (zejména ESFRI).

Centrum bude rovněž poskytovat know-how a případnou podporu pro budování a provoz podobných datových center, jako jsou zejména instalace vznikajících projektů.

4  Harmonogram

Aktuální harmonogram, který je předmětem vyjednávání s MŠMT, předpokládá pořízení prvního SMP clusteru již ve třetím čtvrtletí tohoto roku. Předpokládané parametry jsou alespoň 500 jader a 250 TB pro uživatelská přímo zpracovávaná data. V prvním čtvrtletí 2012 pak bude následovat menší HD cluster se srovnatelným počtem jader a ve druhém čtvrtletí druhý SMP cluster, opět srovnatelné velikosti. Ve třetím čtvrtletí roku 2012 pak přibude velkoobjemové úložiště (500 TB na discích, 2,5-3 PB v páskách nebo speciálním systému vypínatelných disků MAID). Vybavení v rámci první etapy bude završeno nákupem většího HD clusteru v prvním čtvrtletí 2013 (výkon alespoň 4 větší než první HD cluster, doplněný dalšími 350 TB pro uživatelská přímo zpracovávaná data). Průběžně bude pořizováno také programové vybavení.

5  Závěr

Přes zdržení a určitou redukci původního záměru by již v průběhu roku 2011 mělo Centrum CERIT-SC zahájit svou činnost a začít poskytovat první možnosti spolupráce s uživatelskými týmy. Cílem je co nejrychleji připravit uživatele na nové možnosti infrastruktury a současně infrastrukturu připravit na nové požadavky uživatelů. To však nebude možné bez úzké výzkumné a vývojové spolupráce. Veškeré kapacity centra budou poskytovány bezplatně, hodnocena ale bude kvalita a rozsah vědeckých výsledků, které partneři a uživatelé centra s využitím jeho zdrojů a služeb dosáhnou, stejně jako kvalita a míra přímé spolupráce s centrem.

Literatura

[1] L. Matyska: Superpočítačové služby na MU?, Zpravodaj ÚVT MU, 2010, roč. XX, č. 4, s. 17-20.
... zpět do textu
setting
1 Ovšem "SC" v názvu již nereprezentuje"SuperComputer", ale "Scientific Cloud".
... zpět do textu
Zpět na začátek
ÚVT MU, poslední změna 14.11.2011