\"/
\"/ \"/    

JSTOR - šance i pro humanitní výzkum na MU?

Miroslav Bartošek, ÚVT MU
Ročník IX - číslo 5, červen 1999
Citace: M. Bartošek. JSTOR - šance i pro humanitní výzkum na MU?. Zpravodaj ÚVT MU. ISSN 1212-0901, 1999, roč. IX, č. 5, s. 4-8.
Tematické zařazení: Elektronické informační zdroje
 předchozí článek | následující článek 

1    Východiska a historie JSTOR

Za finanční podpory Mellonovy nadace zahájila Michiganská univerzita v roce 1994 projekt JSTOR (Journal Storage), jehož idea byla zhruba následující:

Vytvořit a rozvíjet kompletní digitální archiv všech starých čísel vybrané stovky vědeckých časopisů tvořících jakési "zlaté jádro" severoamerické humanitní vědy (od filosofie přes ekonomii až např. po matematiku) a zpřístupnit jej za výhodných podmínek všem zájemcům z akademické oblasti prostřednictvím Internetu.

Autoři projektu tak chtěli jednou ranou "zabít vícero much", s nimiž se soustavně potýká řada (nejen) amerických akademických institucí:

Vyřešení či alespoň zmírnění uvedených problémů by podstatným způsobem zvýšilo dostupnost informací i efektivitu výzkumu a výuky v příslušných vědních oborech. Současně by i menším institucím otevřelo přístup k velkému množství informací, které doposud nikdy nevlastnily.

2    Oblasti řešení

Přestože již pilotní projekt realizovaný v roce 1995 prokázal jak životaschopnost základní myšlenky, tak dosažitelnost většiny cílů projektu, museli se řešitelé postupně vypořádat s řadou technických, organizačních a legislativních překážek. K těm viditelnějším patřily například:

Výběr vhodného formátu pro ukládání, vyhledávání a zobrazování digitalizovaného materiálu

Články z časopisů jsou nejprve skenovány a uloženy v souborech jako bit-mapové obrázky s rozlišením 600 dpi; každý obrázek je poté konvertován pomocí programů pro rozpoznávání textu (OCR) do podoby digitálního textu, který je dále značkován, indexován a jsou vytvářeny obsahové stránky časopisů. Všechny tři základní komponenty (obrázek, digitální text, obsahová stránka) jsou vzájemně propojeny a uloženy do databáze. Zatímco digitální text a obsahové stránky slouží pro účely vyhledávání, včetně fulltextového, obrázky jsou používány pro zobrazování výsledků; uživatel tak získává na své obrazovce přesnou kopii odpovídající původnímu vzhledu originálního dokumentu (včetně všech speciálních znaků, jinojazyčných textů, matematických symbolů, grafů a obrázků), kterou může vytisknout na lokální tiskárně a dále pak s vytištěnou kopií volně disponovat (včetně poskytování kopie třetí straně, např. prostřednictvím meziknihovní výpůjční služby).

Oboustranně výhodné dohody s vydavateli časopisů

Aby digitální archiv neohrožoval komerční zájmy vydavatelů, je samostatně pro každý časopis stanovena pohyblivá časová hranice (moving wall), po kterou lze časopisy digitalizovat a ukládat do databáze JSTOR; obvyklá hranice je 3-5 let. To znamená, že bez jakýchkoliv poplatků vydavateli lze do databáze ukládat a posléze zpřístupňovat uživatelům veškerá čísla časopisů 3-5 let pozpátku od aktuálního čísla.1 V případě, že vydavatel vydává kromě tištěného časopisu i jeho digitální verzi, je pro tento časopis stanovena v databázi fixní hranice daná okamžikem zahájení digitálního vydávání a jsou zřízeny vazby mezi databází JSTOR a databází digitálních textů časopisu u vydavatele. Starší digitální čísla produkovaná vydavatelem mohou být do databáze JSTOR zařazována na základě individuální dohody s vydavatelem.

Vybudování a zajištění provozu digitalizačních pracovišť a serverů

V digitalizačních pracovištích JSTOR je v současnosti každý měsíc digitalizováno a dále zpracováno více jak 100.000 stran časopisů; náklady na kompletní digitalizaci jedné strany se pohybují kolem 2 USD. Nové příspěvky jsou průběžně přidávány do dvou databází JSTOR provozovaných na univerzitách v Michiganu a Princetonu (od března 1998 je v provozu i evropské zrcadlo databáze na univerzitě v Manchesteru, UK a připravuje se další v Jihoafrické republice). Počátkem roku 1999 bylo zdigitalizováno a zpřístupněno uživatelům přes 3 milióny časopiseckých stran, což představuje orientačně kolem 170 GB obrázků a přes 30 GB indexů a digitálního textu vytvořeného z naskenovaných obrázků programy OCR.

Vytvoření neziskové organizace garantující dlouhodobý provoz a rozvoj služby JSTOR

Přínos projektu JSTOR nespočívá jen v jednorázové retro-digitalizaci starého fondu časopisů, ale také v zajištění spolehlivého fungování celého systému (včetně průběžného doplňování nových informací) i v budoucnosti. Z tohoto důvodu byla již v roce 1995 založena nezávislá nezisková organizace JSTOR garantující další provoz a rozvoj této služby. Jejími institucionálními členy je v současné době více jak 400 významných akademických institucí, převážně z USA. Potřeba existence takovéto organizace se ukazuje též z jiného důvodu: Jedním z cílů digitalizace bývá i dlouhodobá ochrana informací. Často se naivně předpokládá, že přenesením informace z hmotného nosiče podléhajícího postupné degradaci do nehmotné digitální podoby je automaticky zajištěno uchování informace "na věčné časy". Pravý opak může býti pravdou; zatímco informaci vytištěnou na papíře si může za příznivých okolností budoucí uživatel přečíst i po mnohá staletích, leckterá digitální informace se může stát - v důsledku stále se zrychlující technické a technologické inovace - fakticky nedostupnou během několika málo let. Například dnes již prakticky nejsme schopni přečíst si digitální informaci uloženou ve speciálním formátu na 12-ti palcové magnetické pásce před pouhými několika málo lety. Nemáme již k dispozici ani čtecí zařízení pro daný typ pásky, ani programy potřebné pro zobrazení dat zakódovaných do tehdejšího formátu. Podobně obtížným či přímo nemožným úkolem může být pro příští generace získat informace z dnešních CD-ROMů či souborů ve formátu MS-Word. Problém přitom není v jednorázové konverzi nosičů a oživování formátů, ale obecně v zajištění a zaplacení včasné a v nepravidelných intervalech stále se opakující konverze obrovského nakumulovaného množství dat v různých formátech - a to po velmi dlouhou dobu, v řádech staletí! Není divu, že řada knihovníků pracujících s rozsáhlými digitálními sbírkami vyjadřuje dnes značné obavy z toho, kdo a jak bude zodpovědný za to, aby dnešní "digitální dědictví" zůstalo dostupné i budoucím pokolením.

Ekonomický model samofinancování neziskové organizace JSTOR

Rozjezd projektu JSTOR byl umožněn díky počátečnímu 5-milionovému grantu Mellonovy nadace. Další fungování systému však vyžadovalo přechod na systém neziskového samofinancování, který by jednak umožnil pokračovat v digitalizaci nových materiálů, jednak garantoval potřebný pravidelný přísun prostředků na provoz a údržbu celého systému (vlastní informace jsou pak již členům organizace JSTOR k dispozici zdarma). Za tímto účelem byl vypracován způsob dalšího financování prostřednictvím příspěvků zúčastněných institucí. Příspěvek je rozdělen do dvou částí:

Úroveň těchto poplatků je nastavena tak, aby odrážela "velikost" příslušné instituce (v našem prostředí definovanou počtem svazků v knihovnách a počtem předplacených časopisů). Instituce jsou rozděleny do pěti kategorií - velmi velká, velká, střední, malá, velmi malá - a poplatky pro ně se pohybují v rozmezí 45.000-10.000 USD pro DDF a 6.000-2.000 USD pro AAF. Výše poplatků je stanovena s ohledem na cenové poměry severoamerických akademických institucí, pro něž byl JSTOR původně vytvářen.2 V současnosti, kdy JSTOR expanduje i do mimoamerického prostoru, dostaly vybrané instituce střední a východní Evropy (mezi nimi i Masarykova univerzita) nabídku k účasti s výraznými, až 80% slevami z požadovaných poplatků (podrobněji v části 4 tohoto článku).

3    Současný stav

Koncem roku 1999 končí 1. fáze plnění databáze JSTOR. K tomuto datu bude databáze obsahovat kompletní digitální archiv pro 117 pečlivě vybraných amerických vědeckých časopisů z 15 vědních disciplin (průměrná délka vydávání těchto časopisů, plně pokrytá v databázi, se pohybuje kolem 50-ti let):

Afro-americká studia(7 časopisů)
Antropologie(6)
Asijská studia(5)
Demografie(8)
Ekologie(6)
Ekonomie(13)
Filosofie(10)
Finance(5)
Historie(15)
Literatura(10)
Matematika(11)
Politické vědy(10)
Sociologie(8)
Statistika(9)
Vzdělávání(4)

Kompletní seznam časopisů digitalizovaných v 1. fázi spolu s podrobnými informacemi o JSTOR a demo-verzí on-line přístupu k databázi prostřednictvím www lze nalézt na http://www.jstor.org. Jen pro ilustraci uveďme současný seznam časopisů z oboru matematika:

American Journal of Mathematics
American Mathematical Monthly
Annals of Mathematics
Journal of Symbolic Logic
Journal of the American Mathematical Society
Mathematics of Computation
Proceedings of the American Mathematical Society
SIAM Journal on Applied Mathematics
SIAM Journal on Numerical Analysis
SIAM Review
Transactions of the American Mathematical Society

Po roce 1999 se počítá s výběrem dalších titulů, které budou zařazeny do databáze. V současnosti využívá službu JSTOR celkem 373 amerických a 50 mimoamerických akademických institucí, z nichž bylo v uplynulém roce provedeno přes 5 milionů přístupů do systému, realizováno 1.4 milionu vyhledávání, prohlíženy celkem 2.3 miliony stran textu a vytištěno 0.5 milionu článků.

4    JSTOR a Masarykova univerzita

Vedle amerických univerzit se k JSTOR připojují výzkumné instituce i z jiných koutů světa. Masarykova univerzita získala před nedávnem nabídku od Mellonovy nadace připojit se k organizaci JSTOR za zvýhodněných cenových podmínek představujících slevu ve výši 83.5% z jednorázového poplatku DDF a 75% z ročního poplatku AAF. Pokud bychom předpokládali zařazení MU do kategorie středních univerzit, vychází cena za připojení MU na 4.125 USD jednorázového poplatku a pak 1.000 USD ročně po následující tři roky (poté se roční poplatek zvýší na dvojnásobek).

Cenová nabídka tedy vypadá zajímavě; otázkou však zůstává reálný přínos a využitelnost informací z databáze JSTOR pro uživatele na MU, a to jak s ohledem na výhradní orientaci JSTOR na americké vědecké časopisy, tak zejména na chybějící aktuální čísla (3-5 let) jednotlivých titulů. Dosavadní ohlasy ze zemí na západ od našich hranic napovídají, že motivace pro práci se staršími čísly vědeckých časopisů (zejména při možnostech efektivního systematického vyhledávání) může být leckdy nečekaná. Jako příklad mohou posloužit aktivity na univerzitě v New Yorku zaměřené na vyhledávání výpočetních problémů a algoritmů zkoumaných v matematických časopisech před mnoha desítkami let a poté opuštěných, protože v oné době neexistovaly technologie pro jejich řešení. Takže: JSTOR pro Masarykovu univerzitu ano či ne? Názory čtenářů uvítáme (nejlépe na adrese zpravodaj@icsteckamuniteckacz).

setting
1 Na rozdíl například od technických oborů neztrácí vědecké poznatky v humanitních oblastech ani po čase svou cenu.
... zpět do textu
2 V loňském roce vycházela pro průměrnou americkou univerzitu cena článku z JSTOR o dva řády nižší než běžná cena článku zaslaného standardní službou document delivery.
... zpět do textu
Zpět na začátek
ÚVT MU, poslední změna 14.11.2011