\"/
\"/ \"/    

Metapočítače a vysoké školy a Akademie věd České republiky

Luděk Matyska, FI MU, ÚVT MU
Ročník IX - číslo 1, říjen 1998
Citace: L. Matyska. Metapočítače a vysoké školy a Akademie věd České republiky. Zpravodaj ÚVT MU. ISSN 1212-0901, 1998, roč. IX, č. 1, s. 7-10.
Tematické zařazení: Superpočítače a gridy
 předchozí článek | následující článek 

Kapacita a přenosové charakteristiky vysokorychlostních sítí otevírají novou cestu k realizaci vysoce výkonných superpočítačů. Již více než deset let jsou počítače spojené lokální počítačovou sítí používány jako náhražka paralelních superpočítačů - lokální síť propojující jednotlivé počítače substituuje propojovací síť procesorů paralelního počítače. Toto uspořádání umožňuje využít v síti zapojené počítače v době, kdy nejsou svými majiteli využívány (např. počítače administrativního aparátu v mimopracovní době), a současně umožňuje řešit i rozsáhlé úlohy v akceptovatelném čase.

Uvedený přístup má však své hranice, které jsou dány velikostí lokálních sítí a rovněž počtem počítačů, které jsou takto "amatérsky" využitelné. V posledních několika letech se v souvislosti se zaváděním vysokorychlostních sítí podstatným způsobem změnila původní situace, kdy rychlé lokální sítě byly propojovány podstatně pomalejšími spoji. I v České republice je kapacita páteřních spojů vysokorychlostní sítě vyšší než kapacita běžných lokálních sítí na bázi Ethernet (jedná se o rychlost 34Mb/s oproti pouhým 10Mb/s běžného Ethernetu). Spojení Praha-Brno má propustnost vyšší než Fast Ethernet (155Mb/s oproti 100Mb/s). Ještě daleko vyšší rychlosti páteřních spojů můžeme nalézt v akademických sítích Ameriky: v rámci projektu Internet2 se pracuje s rychlostmi do 1,2Gb/s a v příštím roce se počítá s rychlostmi až 9,6Gb/s pro nejdůležitější páteřní spoje.

Metapočítač

V této situaci nepřekvapí, že namísto propojení "obyčejných" osobních počítačů a pracovních stanic dostupných v rámci lokální sítě se pracuje s propojením vysoce výkonných superpočítačů prostřednictvím rychlých páteřních spojů. Namísto náhražky superpočítače tak může být vytvořen stroj, který svým výkonem překoná kterýkoliv instalovaný superpočítač (neboť ten může být jeho součástí). Hovoří se o Metapočítači, virtuálním paralelním (distribuovaném) superpočítači, který může mít i desítky tisíc vysoce výkonných procesorů. Kromě pojmu Metapočítač je možno se setkat i s výrazem Computational Grid či zkráceně Grid (tedy Výpočetní mřížka nebo pouze Mřížka), který označuje prostředí pro vysoce výkonné distribuované výpočty.

Realizace Metapočítače má řadu pozitivních rysů:

na druhé straně se však nejedná o nikterak jednoduchou úlohu. Mezi hlavní problémy realizace Metapočítače patří:

a v neposlední řadě jsou to i problémy politické: jednotlivé superpočítače (uzly Metapočítače) jsou spravovány rozdílnými vlastníky a je vždy nutno překonat jejich odpor ke sdílení vlastních prostředků s cizími uživateli (de facto dochází k určité ztrátě suverenity majitelů ve prospěch celého Metapočítače resp. jeho správců).

META Centrum

Možností využití vysokorychlostní sítě pro vytvoření virtuálního superpočítače, výkonem srovnatelného s technikou dostupnou v západní Evropě, se v roce 1996 začalo zabývat pět vysokých škol České republiky - Karlova univerzita a České vysoké učení technické v Praze, Západočeská univerzita v Plzni a Masarykova univerzita a Vysoké učení technické v Brně - v rámci řešení projektu Centrum - prostředí pro řešení rozsáhlých distribuovaných úloh. Koordinaci a organizační zastřešení tohoto projektu zajišťuje Ústav výpočetní techniky Masarykovy univerzity.

Uzly META Počítače jsou tvořeny superpočítači následujících výrobců:

Kromě uvedené techniky jsou v jednotlivých lokalitách k dispozici další počítače, které většinou slouží jako souborové servery či zajišťují další služby META Centra.

Jak vyplývá z diskuse na začátku příspěvku, realizace Počítače musí pokrýt celou řadu aspektů. Z nich si v souvislosti s projektem META Centrum všimněme následujících tří rovin:

  1. administrativní
  2. technické
  3. výzkumné

Administrativní oblast

Tato část realizace projektu odpovídá za iluzi jednotného výpočetního prostředí celého META Centra. Je vytvořena jednotná databáze uživatelů celého META Počítače, což umožňuje zpřístupnit všechny jeho uzly na základě jediné přihlášky, podané na kterékoliv ze zúčastněných vysokých škol. Současně jsou vyřešeny všechny konflikty uživatelských jmen a tímto způsobem je zajištěna nezpochybnitelná identita každého uživatele.

V rámci celého META Centra byl sjednocen způsob vystavování a především přístupu k instalovanému programovému vybavení. Tím jsou minimalizovány rozdíly mezi jednotlivými instalacemi a uživatelé mohu stejnou posloupnost příkazů používat nezávisle na konkrétním uzlu META Počítače.

Vytvoření jednotné databáze uživatelů umožnilo též zefektivnit správu dostupných zdrojů, ať již se jedná o vlastní výpočetní výkon nebo kapacitu jednotlivých periferií. Je dosaženo lepší kontroly využití celého META Počítače jednotlivými uživateli, což umožňuje pružněji reagovat na jejich požadavky.

Technická řešení

Jednotné prostředí META Centra není možno realizovat bez jednotného systému autentizace uživatelů a bez vhodného distribuovaného systému souborů. Autentizaci uživatelů zajišťuje systém Kerberos verze 4, který obsahuje zabezpečený protokol pro jednotné přihlášení se do systému bez nutnosti posílat uživatelská hesla po síti v otevřené podobě. Systém Kerberos rovněž umožňuje "šířit" jednou ověřenou identitu uživatele na všechny uzly META Počítače bez nutnosti opakovaného zadávání hesla, čímž dále přispívá k vytvoření iluze jediného paralelního superpočítače.

Distribuovaný systém souborů AFS1 pak vytváří iluzi jediného systému souborů, dostupného ze všech uzlů META Počítače. Domovské adresáře uživatelů v AFS jsou na všech uzlech dostupné v adresářích se stejnou absolutní cestou, uživatelé tak mohou používat tutéž cestu při přístupu ke svým souborům bez ohledu na to, se kterým konkrétním počítačem právě pracují. Z důvodu vyšší spolehlivosti mají uživatelé i lokální domovské adresáře na každém uzlu META Centra, AFS slouží jako hlavní velkokapacitní systém souborů.

Prostřednictvím AFS je též zpřístupněna většina aplikačního programového vybavení, což uživatelům umožňuje používat i speciální aplikační programy na různých uzlech META Počítače bez nutnosti jejich nežádoucího kopírování. Spolu se systémem redundantních AFS serverů pouze pro čtení je tak zajištěna vysoká dostupnost dat i při výpadku některého z disků.

Veškeré dlouhé úlohy (nad cca 1 hodinu) musí být spouštěny prostřednictvím správy dávkových úloh. V případě META Centra tuto službu zajišťuje systém LSF (Load Sharing Facility)2. Jednotlivé fronty tohoto systému jsou sjednoceny přes celý META Počítač a současně je ošetřena migrace úloh mezi jednotlivými uzly v závislosti na jejich zatížení a/nebo dostupnosti požadovaného aplikačního programového vybavení.

Výzkum

Podstatnou část výzkumné kapacity projektu představuje přizpůsobování použitého programového vybavení potřebám META Centra. Konkrétně se jedná o rozšiřování autentizačních prostředků systému Kerberos o nové rysy (dostupné zčásti v rámci systému Kerberos 5, který ale není ve zdrojovém tvaru dostupný mimo území USA) a jeho integraci s dalšími autentizačními protokoly (zejména se systémem ssh). V současné době je uspokojivě vyřešena otázka dlouhých úloh (platnost autentizace je časově omezena a může v průběhu dlouhého výpočtu vypršet), odložená autentizace před spuštěním úlohy z fronty, koexistence se systémem ssh, přenos autentizace na další počítače podle potřeby... Další část výzkumu v této oblasti je zaměřena na maximální propojení systémů Kerberos (včetně nových rysů), AFS a LSF a dále propojení se systémem IBM SP2. Cílem je vytvořit takové prostředí, které umožní integraci i dalších výpočetních prostředků (včetně osobních počítačů s operačním systémem Linux) v podobě jak koncových stanic, tak případně dodatečných výpočetních zdrojů.

Otevřeným problémem, který je řešen v rámci projektu META Centrum, je otázka synchronizace distribuovaných výpočtů a odpovídající plánování zdrojů před vlastním spuštěním výpočtu. Distribuovaný výpočet zahrnující několik uzlů META Počítače musí být spuštěn současně na všech počítačích a ty musí mít v okamžiku spuštění k dispozici dostatečnou volnou kapacitu, jinak dochází k neúměrnému prodlužování doby výpočtu (a tím k potlačení požadovaného efektu paralelizace, kterým je zkrácení celkové doby výpočtu).

Závěr

Realizace META Počítače představuje jeden z důsledků zavádění vysokorychlostních sítí do akademického prostředí České republiky. Spojením výkonných výpočetních serverů se podařilo vytvořit virtuální superpočítač, který uživatelům umožňuje řešit i výpočetně velmi náročné úlohy, jiným způsobem v ČR nerealizovatelné. Distribuovaný charakter META Centra přitom zmírňuje regionální nerovnováhu a vytváří příležitost rovného přístupu k výkonné výpočetní technice nezávisle na dislokaci konkrétního uživatele. Spolupráce vysokých škol v této oblasti rovněž přispívá k minimalizaci nákladů na technické, ale především programové vybavení: konkrétními aplikačními programy postačí vybavit pouze určité uzly META Centra, přístup k těmto systémům však mají všichni uživatelé (dovoluje-li to samozřejmě licenční politika)3. Otevřený charakter Centra přitom tyto možnosti otevírá všem zájemcům včetně studentů z vysokých škol a Akademie věd a tím přispívá k výchově budoucích odborníků, schopných využít superpočítačovou techniku i pro řešení konkrétních úkolů průmyslu a služeb.

setting
1 M. Ruda, L. Matyska. AFS - nová generace sdílení souborů po síti. Zpravodaj ÚVT MU, 1997, roč. 7, č. 3, s. 13-16.
... zpět do textu
2 S jedinou výjimkou, kterou je uzel IBM SP2 na ČVUT v Praze. Tam je správa dávkových úloh zajištěna systémem LoadLeveler. V rámci řešení projektu se hledají cesty vzájemné komunikace obou systémů správy dávkových úloh tak, aby tento rozdíl byl pro koncového uživatele transparentní - zejména, chce-li využívat počítač IBM SP2 pouze pro dávkové úlohy.
... zpět do textu
3 Příkladem mohou sloužit programy Gaussian, ANSYS a Fluent, které jsou k dispozici jen v některých uzlech. Uživatel může zadat úlohu na výpočet kterýmkoliv z uvedených programů v kterémkoliv uzlu a systém sám zajistí spuštění úlohy na tom počítači, kde je požadovaný program licencován.
... zpět do textu
Zpět na začátek
ÚVT MU, poslední změna 14.11.2011