\"/
\"/ \"/    

Sdružená matrika studentů

Petr Koudelka, Jana Kohoutková, ÚVT MU
Ročník X - číslo 1, říjen 1999
Citace: P. Koudelka, J. Kohoutková. Sdružená matrika studentů. Zpravodaj ÚVT MU. ISSN 1212-0901, 1999, roč. X, č. 1, s. 5-9.
Tematické zařazení: Informační systémy MU
 předchozí článek | následující článek 

Zákon o vysokých školách1 s účinností od 1.1.1999 ukládá vysokým školám povinnost vést matriku studentů. Matrika, která obsahuje předepsané základní údaje o jednotlivých studentech vysoké školy zapsaných do bakalářského, magisterského nebo doktorského studijního programu, slouží k evidenci o studentech a k rozpočtovým a statistickým účelům. Ministerstvo školství, mládeže a tělovýchovy ČR (MŠMT ČR) je oprávněno informace z matrik studentů jednotlivých vysokých škol přebírat a ke stejným účelům (rozpočtovým a statistickým) využívat. Tolik k zákonnému vymezení rámce dalšího děje.

Na podzim loňského roku, kdy bylo datum účinnosti zákonné povinnosti vést matriky studentů nadosah, vypsalo MŠMT ČR výběrové řízení na realizaci typového projektu SIMS (Databáze Sdružených Informací Matrik Studentů), tedy realizaci sdružené matriky vysokoškolských studentů ČR. Ve výběru nejlépe obstál návrh řešení předložený Masarykovou univerzitou (Ústavem výpočetní techniky a Útvarem systémového řízení a organizace RMU). Realizace byla zahájena v prosinci loňského roku a projekt byl v rozšířeném rozsahu původního zadání dokončen k 31.8.1999.

Zadání projektu

Zadáním projektu SIMS bylo vybudovat systém pro sběr a zpracování dat z matrik studentů vysokých škol. Jak zdrojová data, tak zpracované výstupy systému měly být diferencovaně přístupné různým skupinám oprávněných uživatelů, výsledky zpracování byly primárně určeny pro potřeby Ministerstva školství, mládeže a tělovýchovy. Součástí zadání byla i technická specifikace - server třídy PC s prostředím MS Windows.

Cílem projektu tedy bylo definovat rozhraní mezi zdroji dat (samostatnými informačními systémy vysokých škol) a sdruženou matrikou studentů ČR spravovanou MŠMT, zprůchodnit zabezpečený přenos informací přes tato rozhraní a zajistit jejich centrální zpracování a diferencovanou přístupnost.

K obecným požadavkům kladeným na SIMS patřily:

Principy řešení

Implementované řešení je koncipováno jako modelové řešení, obecně aplikovatelné na sběr, zpracování a prezentaci libovolných informací. Mechanismy sběru dat, jejich přenosu a zpracování a prezentace výsledků jsou popsány v následujících odstavcích.

Lokální sběr a údržba informací
Vysoké školy udržují informace o studentech ve svých nezávislých informačních systémech, které naplňují daty, spravují a aktualizují. Tato (lokální) vrstva je tedy plně v režii a zodpovědnosti vysokých škol - sdružená matrika ji ovlivňuje pouze v tom smyslu, že určuje její zcela minimální informační obsah.

Export dat a přenos dat
Pro předávání dat je mezi lokálními studijními systémy vysokých škol a sdruženou matrikou MŠMT definováno jednotné rozhraní - jak datovým obsahem, tak formátem. Byl stanoven jednotný předávací formát, jímž je textový soubor se závazně definovaným datovým obsahem (podrobněji se k němu vrátíme v části Data matriky) a strukturou - jednotlivé záznamy oddělené znakem konce řádku, položky záznamů oddělené dohodnutým oddělovačem, znaková sada ISO Latin 2. Významově jeden záznam odpovídá jedné etapě historie studia (podrobněji opět viz část Data matriky) studenta na vysoké škole, položkami záznamů jsou atributy historie studia. Při sběru dat vysoké školy exportují data ze svých databází do tohoto formátu a z důvodu bezpečnosti a zajištění nepopiratelnosti přenosový soubor s exportovanými daty povinně digitálně podepisují a šifrují. Při realizaci bezpečnostních mechanismů bylo použito produktu Pretty Good Privacy (minimální délka generovaného klíče musí být 1024 bitů - tzv. commercial stupeň bezpečnosti). Podepsaný a šifrovaný soubor matričních dat svých studentů ukládají vysoké školy v předem stanoveném termínu na server SIMS.

Centrální zpracování získaných dat
Po uložení dat matriky vysoké školy se na serveru SIMS ověřuje jejich správnost. Pouze úspěšné záznamy, které vyhoví všem kontrolám, jsou importovány do centrální databáze SIMS. První fází testů je ověření digitálního podpisu a dešifrování poslaného souboru. Následuje sekvenční kontrola, při níž se postupně kontrolují všechny položky všech záznamů v souboru vzájemně mezi sebou v rámci jednoho záznamu. Ověřuje se jednak maximální délka každé položky, její správný datový typ a splnění podmínek vymezujících rozsah hodnot, ale i vzájemná vazba položek v záznamu (hodnota jedné položky zpravidla určuje rozsah hodnot jiné položky nebo položek). Záznamy, které projdou sekvenční kontrolou, se importují do sběrné databáze, kde se nad nimi provádí v pořadí třetí, tzv. křížová kontrola. Při křížové kontrole se kontrolují záznamy v souboru jednak vzájemně mezi sebou, jednak vůči již existujícím aktuálním záznamům sdružené matriky. Například má-li student, jednoznačně identifikovaný rodným číslem, v centrální databázi SIMS příjmení "Novak" a v souboru nově přijatém od téže vysoké školy příjmení "Novák", vypíše se uživateli (zasilateli dat) varování, že hodnota "Novak" byla přepsána hodnotou "Novák", a záznam studenta se do sdružené matriky přijme. Pokud však například na sebe časově nenavazují jednotlivé záznamy historie určitého studia, vypíše se uživateli chybové hlášení a záznam resp. celou sekvenci záznamů o tomto studiu sdružená matrika odmítne přijmout.

Aktualizace databáze SIMS a výpočet přidaných položek
Po kontrolách se centrální databáze SIMS aktualizuje těmi záznamy, které úspěšně prošly všemi testy. Aktualizace se provádí až po ukončení sběru, tedy poté, co všechny vysoké školy uložily do sběrné databáze na serveru SIMS data o svých studentech (nebo poté, co vypršela závazná lhůta, po kterou tak měly učinit). Nad aktualizovanou centrální databází SIMS se následně dopočítají další přidané položky, které se doplňují pro potřeby zpracování výstupů (typicky se například z údajů dodaných do sdružené matriky vysokými školami podle určeného algoritmu dopočítává atribut "student rozpočtový", který se používá při generování podkladů pro financování studijních programů vysokých škol).

Generování výstupů a prezentace výsledků
Z pohledu zpracování lze výstupy generované z dat sdružené matriky rozdělit do dvou kategorií: statické (vygenerované po každém novém sběru podle předem stanovených pravidel) a dynamické (generované na požádání). Dynamické výstupy s výhodou umožňují uživateli zadávat různé výběrové podmínky nebo parametry, jimiž ovlivňuje rozsah a uspořádání výstupního přehledu. Výsledné sestavy jsou buď generovány do formátu HTML a prezentovány webovým prohlížečem, nebo jsou předávány v textovém formátu programu MS Excel, který se automaticky spouští k prezentaci a zpracování dalších sestav.

Výstupy matriky

Požadované výstupy ze sdružené matriky spolu s formulací zákona o VŠ určují rozsah povinných údajů předávaných z vysokých škol. Základní výstupy ze sdružené matriky, specifikované v zadání projektu SIMS, jsou obsahově trojí: přehledy o ubytování v kolejích, volitelné statistické přehledy a zejména přehledy pro financování studijních programů VŠ. Výstupy ze SIMS mají v nejbližších letech verifikovat údaje, které doposud poskytují MŠMT jednotlivé vysoké školy v předepsaných souborných výkazech, a v další budoucnosti tyto výkazy zcela nahradit.

Statistické přehledy poskytují souborné informace o počtech vysokoškolských studentů členěné podle škol, studijních programů, typů studijních programů a forem studia. Jsou parametrizovatelné celou řadou atributů ve variabilních hodnotových rozsazích a jsou určeny k co nejširšímu využití - od poskytování podkladů Akreditační komisi pro akreditace studijních programů vysokých škol po vyhodnocování úspěšnosti absolventů středních škol jako jednoho z kritérií pro hodnocení a vzájemné srovnávání středních škol.

Pro přehledy o financování studijních programů VŠ jsou povinnými matričními údaji vedle kódu státu a kvalifikátoru státního občanství (které jsou nutným základem pro určení, zda studium může být financováno ze státního rozpočtu ČR) zejména údaj o způsobu financování (z jakých prostředků je konkrétní studium financováno - údaj je nutný pro stanovení výše finančního příspěvku z resortu MŠMT) a údaj o tom, zda je student klasifikován jako nově přijatý2 (údaj je nutný pro identifikaci skutečnosti, že studium studenta bude financováno částkou sníženou podle tzv. koeficientu propadu3). Platnost posledních dvou údajů se sdruženou matrikou následně ověřuje.

Přehledy o ubytování v kolejích jsou základem pro dotační politiku MŠMT v oblasti ubytování studentů. Kromě základních výstupů se data SIMS bezprostředně využijí i pro potřeby demografických analýz a verifikace sociálních příspěvků - konkrétně např. příspěvku na dopravu; proto patří k povinným údajům matriky i kód okresu bydliště a kód obce místa výuky.

Data matriky

Datem zahájení platnosti zákona o vysokých školách je určeno, že matriky studentů vysokých škol, a tedy i sdružená matrika, musí obsahovat údaje o všech studentech vedených na vysokých školách (zapsaných do některého studijního programu, ať již aktivně studujících nebo se studiem přerušeným) počínaje datem 1.1.1999.

Základní informační jednotkou matriky jsou data o "studentu ve spojení se studijním programem, který studuje na dané škole/fakultě". Pro automatizovaný sběr dat do sdružené matriky jsou tato data linearizována tak, že jeden záznam předávaný mezi vysokými školami a MŠMT ČR je záznamem jedné etapy historie konkrétního studia konkrétního studenta na konkrétní vysoké škole. Položky záznamu matriky tedy tvoří tři okruhy:

Student je identifikován svým rodným číslem, což s sebou samozřejmě nese všechny problémy tradičně spojené s fenoménem rodného čísla. Nejproblematičtější je přidělování rodných čísel studentům-cizincům: pokud jde o studenty, jejichž studium alespoň částečně hradí Česká republika, stanoví jim matrika povinnost nechat si rodné číslo přidělit4, v případě studentů-samoplátců však neexistuje obhajitelný důvod, proč by námahu spojenou se získáním rodného čísla měli podstupovat. Proto se těmto studentům přidělují náhradní "rodné kódy"5: pro první hromadný sběr dat přidělují rodné kódy svým studentům jednotlivě vysoké školy, v budoucím provozu se centrální autoritou pro přidělování kódů stane právě sdružená matrika. Osobní údaje o studentovi dále povinně obsahují příjmení, kód okresu bydliště, kód státu a kód předchozího vzdělání - o využití posledních tří údajů jsme se již zmínili ve stručném popisu základních výstupů sdružené matriky.

Studium je identifikováno rodným číslem studenta, kódem vysoké školy (fakulty), kódem studijního programu a datem zahájení studia. V této čtveřici klíčových údajů se nejproblematičtějším místem stal kód studijního programu, protože paralelně s řešením projektu SIMS (a co hůře, paralelně s testováním vývojového systému daty z vysokých škol) přecházel systém identifikace studijních programů vysokých škol ČR ze staré (7-ciferné) verze na verzi novou (5-znakovou). V současné době je nový kódovník studijních programů již několik týdnů stabilní, ale použití předchozího číselníku v identifikaci již probíhajících studií a konverze jejich kódů na nové má za následek, že změny kódů u několika problematických studijních programů bude nutno v datech sdružené matriky individuálně ošetřovat s výhledem dalších dvou let. Povinnými údaji o studiu jsou typ studijního programu a délka studia (statistické údaje), dále údaj o tom, zda je student z pohledu financování klasifikován jako nově přijatý, a konečně údaj o tom, zda a s jakým výsledkem žádal o ubytování v koleji.

Etapa historie studia představuje souvislý časový úsek, v němž nedošlo ke změnám těch atributů studia, které jsou významné z pohledu statistik a financování (jako jsou přerušení studia a návrat po přerušení, změna formy studia nebo změna způsobu financování), a tedy musí být do sdružené matriky zaznamenány. Je identifikována klíčovými údaji o studiu a datem zahájení etapy historie studia. K této pětici klíčových údajů jsou dalšími povinnými údaji kvalifikátor státního občanství, kód obce místa výuky, forma studia, způsob financování a údaj o přerušení studia.

Z celkem 48 matričních údajů jsou téměř dvě třetiny vázány na číselníky (povinné kódy států a okresů, ale i nepovinné kódy obcí, částí obcí a PSČ u adres, kódy VŠ, kódy studijních programů, oborů a aprobací, kódy typů a forem studia atd.), z nichž některé byly zkompilovány pro potřeby SIMS, a tedy mají v SIMS primární zdroj, zatímco jiné byly převzaty z různých zdrojů z oblasti školství i mimo ni6.

Technická realizace

Základní princip technické realizace systému SIMS tvoří (v současné době nejpopulárnější a nejdynamičtější) webová architektura se svou nedocenitelnou předností - dostupností: klientovi stačí pro přístup k serveru běžný webový prohlížeč. Architekturu systému SIMS přibližuje následující obrázek.


Architektura SIMS
 

Oprávněnými klienty SIMS (s diferencovanou mírou oprávnění) jsou uživatelé z jednotlivých vysokých škol zodpovídající za posílání dat, dále zadavatelé z MŠMT požadující od sdružené matriky předepsané výstupy a konečně správce zodpovídající za chod celého systému SIMS. Na straně klienta je nutný webový prohlížeč podporující protokol HTTPS, například MS Internet Explorer od verze 4.0 nebo Netscape Navigator od verze 3.0. Klienti se připojují pomocí prohlížeče k web serveru a při prvním přístupu jsou požádáni o zadání svého přihlašovacího jména a hesla. Pokud se uživatel úspěšně autentikuje, zobrazí se mu menu, z něhož si může vybrat akci (zobrazení položek v menu závisí na právech a typu uživatele), kterou chce provést. Distribuce přihlašovacích jmen a hesel a výměna otisků (fingerprintů) klíčů PGP proběhla oficiální písemnou cestou mezi MŠMT a rektory VŠ.

Web server zajišťuje veškerou komunikaci s klienty. V případě SIMS je použit web server MS Internet Information Server 4.0.

Presentační logika se stará o provádění jednodušších akcí (složitější části systému jsou vykonávány pomocí aplikační logiky). Skládá se ze skriptů, které tvoří uživatelské rozhraní mezi klientem a systémem SIMS. Skripty jsou spouštěny web serverem, reagují na požadavky klienta a generují pro klienta výstupy. Jsou napsány ve skriptovacích jazycích VBScript a PerlScript a využívají technologie ASP (Active Server Pages).

Aplikační logika se stará o provádění složitějších a náročnějších činností systému SIMS. Zejména zajišťuje provádění kontrol (sekvenčních, křížových), aktualizaci dat, zálohování systému a podobně. Tato vrstva je implementována v programovacích jazycích Visual Basic, C++, Perl a TSQL (procedurální jazyk SQL Serveru).

Nejdůležitější vrstvou je samozřejmě databáze, v níž jsou uložena veškerá matriční data studentů a informace nutné pro běh a správu systému SIMS. Opět bylo použito databázového produktu firmy Microsoft - SQL Serveru verze 7.0.

Výhledy blízké i vzdálenější

Implementace projektu SIMS byla ověřena testovacím sběrem, který funkčnost systému prověřil letos v červnu (sbírána byla data matrik studentů platná k 1.5.1999, a to celá historie). Ze 23 vysokých škol ČR se sběru nezúčastnilo 6 (mezi nimi všechny vysoké školy uměleckého zaměření sídlící v Praze). V současné době probíhá druhý testovací sběr s uzávěrkou 30. září a do 15. listopadu je plánován první ostrý sběr dat, který již využije MŠMT ČR při stanovování nového rozpočtu vysokých škol - sbírána budou data platná k 31.10.1999.

K 31.8.1999 byla první etapa projektu SIMS uzavřena: je definováno rozhraní mezi matrikami vysokých škol a sdruženou matrikou MŠMT, zprůchodněn zabezpečený sběr dat a sdružená matrika poskytuje zadavatelům projektu požadované výstupní přehledy. V současné době probíhají jednání o druhé etapě, která by měla být rozšířením stávající verze jak pro potřeby těch, kdo data sbírají, tak pro potřeby těch, kdo data poskytují nebo o nichž data pojednávají. Jedním z důležitých budoucích rozšíření by měla být možnost zajistit vysokým školám jako poskytovatelům dat přístup jednak k informacím, které do sdružené matriky předaly, ale zároveň i k vybraným souvisejícím informacím - například zda určitý student je (nebo v zaznamenané minulosti byl) studentem jiné vysoké školy. A zcela samozřejmým a oprávněným požadavkem jednotlivce - do budoucna jistě vyžadovaným - je mít možnost zjistit, jaké údaje jsou o něm ve sdružené matrice MŠMT vedeny.

Diskuse na téma sdružené matriky studentů VŠ ČR probíhá mezi zadavateli projektu, zástupci vysokých škol a řešiteli projektu neveřejně v prostředí vytvořeném k tomuto účelu na serveru sdružené matriky. Připomínky a dotazy lze však posílat i mimo tuto interní diskusi - zadavatelům projektu na adresu sims@msmtteckacz a řešitelům projektu na adresu sims@icsteckamuniteckacz.

setting
1 zákon č. 111/1998 Sb., o vysokých školách a o změně a doplnění dalších zákonů (o vysokých školách)
... zpět do textu
2 jde o jeho první přijetí na VŠ v ČR, a to do úvodní etapy studia
... zpět do textu
3 poměr počtu studentů, kteří předčasně ukončili studium v počátečním akademickém roce svého studia, k počtu všech loni nově přijatých studentů
... zpět do textu
4 Této povinnosti není zcela jednoduché vyhovět, protože se rodné číslo přiděluje pouze na dvou místech v ČR, v Praze nebo v Brně, a to v závislosti na datu narození (osoby narozené před rokem 1969 žádají o přidělení rodného čísla Českou správu sociálního zabezpečení v Praze, osoby narozené v roce 1969 a mladší žádají Český statistický úřad v Brně).
... zpět do textu
5 Rodné kódy jsou analogicky jako rodná čísla 10-znakové, prvních šest znaků se odvozuje z data narození stejně jako u rodného čísla, další dva znaky se odvodí z číselníkového kódu vysoké školy, dalším znakem je povinně písmeno (libovolné ASCII) a posledním znakem je cifra nebo písmeno. Takto navržené kódy mají větší hodnotový rozsah než rodná čísla, která jsou vázána na dělitelnost 11, proto nehrozí jejich vyčerpání.
... zpět do textu
6 Převzaté číselníky představují pro SIMS nutnost registrovat se jako uživatel u zdrojových institucí a jako takový být veden pro distribuci (informací o existenci) aktualizovaných verzí. Nesou s sebou sice druhořadý, ale přesto nepříjemný problém, že vzájemné vazby mezi nimi nejsou vždy konzistentní (například vazby mezi číselníkem PSČ udržovaným Českou poštou a číselníkem středních škol udržovaným Ústavem pro informace ve vzdělávání, který obsahuje jak aktuálně platné, tak historické kódy a na ně vázané adresy škol).
... zpět do textu
Zpět na začátek
ÚVT MU, poslední změna 14.11.2011