V článku Masarykova univerzita na internetových WWW stránkách, který vyšel jako informace o nově vyvíjené WWW prezentaci Masarykovy univerzity, bylo zmíněno, že ke správě dat pro prezentační systém MU bude co nejvíce využit plnohodnotný databázový systém. Prezentace byla veřejně zpřístupněna 24. března 1997 na http://www.muni.cz, takže má nyní za sebou šest měsíců vývoje (a celou řadu zajímavých zkušeností). V následujícím textu se blíže podíváme na to, jak byl navržen a jak se vyvíjí právě zmíněný podpůrný databázový systém, jak po stránce obsahové, tak funkční.
Vznik a vývoj obecné databáze shromažďující informace určitého druhu se dá rámcově rozdělit do několika etap:
Prvotním důvodem pro zřízení personální databáze zaměstnanců MU (v dalším textu se na ni budeme zcela neosobně odkazovat zkratkou PDZ) bylo poskytnout kvalitní informační bázi o zaměstnancích MU souběžně běžícímu projektu budování prezentačních WWW stránek univerzity. Data byla zejména zapotřebí pro vytvoření kolekce osobních WWW stránek s kontaktními údaji na každého zaměstnance univerzity, jako jsou adresa pracoviště, telefon na pracoviště, fax na organizační jednotku, URL fotografie, URL osobní WWW stránky a v neposlední řadě e-mailová adresa. Správu dat jsme se od začátku rozhodli svěřit plně funkčnímu a spolehlivému databázovému systému, protože se dalo předpokládat, že objem dat a požadavky na pružnou a zabezpečenou manipulaci s nimi - jak po stránce jejich vlastní organizace, tak po stránce dynamických výběrů pro WWW - s časem trvale porostou. S tímto rozhodnutím jsme narazili na první závažnější realizační problém, a to na volbu mezi distribuovaným nebo centralizovaným přístupem k organizaci databáze.
Pro distribuovanou databázi hovořil především fakt, že obecně by informace měla být uložena v místě svého vzniku, tj. na příslušných fakultách a ostatních samostatných subjektech univerzity, aby se případné změny projevovaly s co nejkratší prodlevou. Navíc distribuovanost zaručuje ochranu přístupnosti větší části báze dat proti možnému výpadku některého ze zúčastněných serverů. Distribuované řešení má ovšem i značné nevýhody, mezi jiným:
Naproti tomu centralizovaný přístup zaručuje kompaktnost a koncentrovanost informace, řádově menší finanční nároky na zřízení a údržbu, odstranění problému sjednocení platforem a distribuce změn. Slabými místy tohoto přístupu ovšem jsou:
Po zvážení kladů a záporů obou přístupů jsme se jednoznačně přiklonili k centralizovanému řešení - pro jeho snazší udržovatelnost a mnohem menší nároky na výpočetní kapacitu a lidské zdroje.
S volbou centralizovaného přístupu jsme si tedy kromě výše zmíněných kladných vlastností přinesli i obě záporné (problémy výpadku a shromažďování dat), které bylo nutné již ve fázi návrhu systému řešit. Proto byl navržen a realizován systém preventivního pravidelného zálohování databáze a programového kódu na centrálním serveru a vytvořena záložní výpočetní kapacita (záložní server), na kterou centrální server automaticky replikuje svou databázi a která je schopna jeho funkci kdykoliv zastoupit.
Složitějším problémem bylo navrhnout systém plnění PDZ iniciálními daty a zajistit jejich pravidelnou aktualizaci. Z již existujících personálních a mzdových databází zaměstnanců MU, fyzicky umístěných a spravovaných na ÚVT (skupinou ASŘ), jsou každý měsíc automaticky importovány aktualizované údaje o všech právě zaměstnaných osobách na MU. Jedná se především o osobní číslo, jméno, příjmení, tituly a rodné číslo (kvůli jednoznačné identifikaci při spojování např. s fakultními databázemi telefonních čísel a elektronických poštovních adres). Tato data tvoří základ společný pro všechny zaměstnance. Na něj navazuje vrstva informací, které se ve mzdové databázi nevyskytují a v personální databázi se vyskytují omezeně (s tím, že jejich obsah není fakultami spolehlivě udržován), jako jsou telefon, e-mail, URL fotografie a osobní WWW stránky a další. Zvažovali jsme dvě možná řešení. Prvním byla přímá editace osobního záznamu jeho vlastníkem, druhým shromažďování těchto informací správci ustavenými pro jednotlivé subjekty univerzity, od nichž si data bude systém automaticky přebírat po dávkách (například měsíčních). V současné době jsou implementovány obě eventuality, pouze přímou editaci vlastníkem jsme - kvůli problémům s masovou distribucí přístupových hesel a vůbec samotnou ochotou vlastníků tyto své informace udržovat - nahradili on-line editací databáze na úrovni subjektu příslušného vlastníkovi. Tento postup se osvědčil především pro fakulty neudržující databáze kontaktních informací zaměstnanců a bylo jím získáno cca 50% všech telefonních čísel a e-mailových adres. Pro fakulty, kde databáze kontaktních dat existují, se uplatňuje varianta synchronizovaného přenosu dat zašifrovaných pomocí PGP (Pretty Good Privacy) přes FTP a jejich následné automatické vkládání do PDZ. Touto cestou spolehlivě proudí aktuální data z Fakulty informatiky každou noc již asi pět měsíců.
Databázové schéma PDZ muselo být od počátku navrhováno s ohledem na skutečnost, že PDZ bude využívána především pro domovské stránky, které jsou součástí česko-anglické (Č/A) WWW prezentace, takže je nutné většinu údajů udržovat dvojjazyčně. Aktuální verze databáze obsahuje následující tabulky:
V současné době je PDZ umístěna na počítači typu PC (technicky se jedná o jednoprocesorové PENTIUM PRO na 200 MHz s 128MB operační paměti a 2 GB úložného prostoru). Celý systém je softwarově založený na proprietárním řešení firmy Microsoft, a to především kvůli dobrému poměru cena/výkon umocněnému ještě slevami v rámci projektu SELECT. Základním kamenem je operační systém Windows NT Server 4.0, jako databázový stroj slouží MS SQL Server 6.5. WWW služby zajišťuje MS Internet Information Server 3.0, jako scriptovací jazyk je zde použit Visual Basic Script (VBS) s technologií Active Server Pages (ASP). Šifrování pomocí asymetrických klíčů (1024 bitů) a digitálního podpisu obstarává PGP 2.6.3i. O správné kódování češtiny se stará NT verze všeobecně oblíbeného programu C-SaCzech verze 1.3.2 Jaromíra Dolečka. Pro představu o současném stavu využití PDZ: pole e-mail je naplněno z 44,58% a telefon z 63,9%, zatímco např. URL fotografie má vyplněno pouze 3,81% zaměstnanců. Vytíženost serveru je taková, že denně v průměru poskytuje informace o 800 zaměstnancích MU.
S postupem doby a průběžným plněním databáze osobními údaji byly zřízeny sady stránek s telefonními a e-mailovými seznamy, poskytující jednotlivým organizačním jednotkám (katedrám) a jejich nadřízeným subjektům (fakultám) další informační služby. K dnešnímu dni jsou poskytovány následující služby:
Po půlročním provozu dozná struktura PDZ v nejbližší době několik významných změn. Nejpatrnější z nich - projeví se totiž v novém tvaru osobní stránky zaměstnance - bude bezesporu přesun informací o zaměstnanci (jako jsou číslo kanceláře, telefon, e-mail, URL osobní WWW stránky atd.) z tabulky Zamestnanci do tabulky Pracovni_Funkce, aby, jednoduše řečeno, každý zaměstnanec mohl mít na své stránce pro každou svou pracovní funkci oddělený e-mail, telefon a další kontaktní informace. Navíc se sada těchto informací rozšíří o pole pro URL české i anglické verze domovské stránky zaměstnance a stránek s životopisem, publikacemi, pedagogickou činností, konzultačními hodinami a dalšími osobními informacemi. Do databáze se rovněž přesunou data pro dynamické generování kalendářů významných akcí pořádaných jednotlivými subjekty MU, které jsou zatím statické a nesplňují přirozený a zcela oprávněný požadavek na možnost on-line aktualizace oprávněnými správci.
Na úplný závěr konkrétních plánů ještě něco méně konkrétních představ: Databázový server a na něm založené prezentační WWW stránky MU zatím nijak nepodchycují publikační a vědeckovýzkumnou činnost MU, což je bezesporu nedostatek; server by totiž mohl být velmi dobře využit k evidenci ukončených i rozpracovaných vědeckovýzkumných projektů, na nichž MU spolupracuje, a tím přispět k vytváření odborných kontaktů. Stejnou roli by mohl (a měl?) plnit i v evidenci publikací vycházejících na půdě Masarykovy univerzity. Zcela samostatnou kapitolou je možné využití serveru a existující PDZ pro potřeby nově vznikajícího ekonomického systému MU, ale tady nepředbíhejme - dá se předpokládat, že na toto téma se na stránkách Zpravodaje dočteme ještě mnohé.
[1] | J. Kohoutková.
Masarykova univerzita
na internetových WWW stránkách.
Zpravodaj VII/3.
... zpět do textu |
[2] | J. Doleček.
CSaCzech - kódování češtiny
na Webovských stránkách.
Zpravodaj VII/2.
... zpět do textu |