V počítačových sítích se již řadu let hromadí znalosti z nejrůznějších oborů. Stejně jako u jiných zdrojů informací je i u počítačových sítí velmi důležitá schopnost informace v nich efektivně vyhledávat.
Odkazy na faktografické materiály (soubory) k mezinárodním počítačovým sítím lze najít v [1]. V tomto článku půjde spíše o obecné strategie, které se osvědčily během dosavadní praxe.
Všechny zde popsané postupy lze použít na BITNETových uzlech. Téměř stejné možnosti1 mají i uživatelé univerzitní TCP/IP sítě, pouze musejí příkazy pro servery zasílat elektronickou poštou, a ne interaktivně, jak je to možné v BITNETu.
Souborové servery v BITNETu jsou implementovány pomocí programu
LISTSERV, rozšířeného na více než 200 uzlech; nejbližší z nich má adresu
LISTSERV@CSEARN. Tyto servery zároveň
zajišťují distribuci zpráv v BITNETových diskusních skupinách.
Stručný přehled příkazů pro LISTSERV lze získat příkazem help
,
například
tell listserv at csearn help |
Seznam souborů, které obhospodařuje, zasílá LISTSERV na příkaz
index
. Seznam bývá často hierarchicky členěn, vyskytují se v něm
soubory xxx FILELIST
, obsahující "podadresáře". Pro
zasílání jednotlivých souborů slouží příkaz get
, například
tell listserv at csearn get listserv refcard |
Stejně zaměření lidé komunikující pomocí počítačových sítí bývají sdruženi v diskusních skupinách (mailing lists). Podstatou diskusních skupin je mechanismus, který rozesílá zprávy od libovolného účastníka všem členům skupiny. Podrobnosti o diskusních skupinách se lze dočíst v [4] a [3].
U mnoha BITNETových skupin existuje velice užitečná možnost vyhledávání v archivech. Díky této funkci lze z příspěvků dosud zaslaných do diskusní skupiny efektivně vybrat ty, které se týkají tématu, jež nás zajímá. Často se tak podaří získat podstatně úplnější informaci než při přímém dotazu zaslaném do skupiny.
K automatizovanému vyhledávání v archivech slouží program LDBASE, který je
nainstalován na brněnském uzlu CSBRMU11 na disku PUBLIC 191 (tento disk je
standardně připojen) i na pražském CSPUNI12
na disku MUSYS 191. Úplný popis funkcí LDBASE je v souboru
LISTDB MEMO
2,
který lze získat například příkazem
tell listserv at csearn get listdb memo
Program LDBASE se spouští příkazem
LDBASE node |
kde node je jméno uzlu, kde se archiv skupiny nachází. Jména archivů a případně jiných databází spravovaných programem LISTSERV na daném uzlu se vypíší příkazem
tell listserv at node database list |
Prvním příkazem po spuštění LDBASE je příkaz SEARCH, zadávaný zpravidla ve tvaru
SEARCH podmínka IN jméno_skupiny
SINCE datum |
Takto zadaný požadavek vyhledá všechny příspěvky, v jejichž textu se vyskytuje
některá z kombinací slov odpovídajících zadané podmínce, přičemž se uvažují
jen příspěvky od daného data (není-li zadáno SINCE datum
,
prohledává se celý archiv). Například
SEARCH (OS2 or 'OS/2') and (FTP or TCP)
in PCIP since 90 |
vyhledá v diskusní skupině PCIP všechny příspěvky od roku 1990 obsahující "OS2" nebo "OS/2" (na malých/velkých písmenech zde nezáleží) a "FTP" nebo "TCP" (cílem tohoto dotazu je získání informací o TCP/IP pod operačním systémem OS/2).
Příkaz
INDEX |
vypíše seznam příspěvků vybraných posledním příkazem SEARCH, obsahující pro každou položku datum, velikost, téma (Subject) a číslo příspěvku v archivu. Příkaz
PRINT |
vypíše celý text příspěvků vybraných při posledním SEARCH. Příkazy INDEX a PRINT v základní podobě vypisují nejvýše 20 řádků3, což je zejména u PRINTu nedostatečné. Toto omezení lze obejít zadáváním příkazů ve tvaru
SENDBACK INDEX |
což zajistí zasílání výsledků elektronickou poštou.
Při rozsáhlejším vyhledávání se osvědčila strategie, kdy je nejdříve vytvořen poměrně rozsáhlý seznam potenciálně zajímavých příspěvků (pomocí SEARCH a INDEX). Z něho jsou pak ručně vyselektovány podle položky Subject: ty nejzajímavější a přímo vytaženy z archivu podle svých
SEARCH * IN jméno_skupiny.n1,n2,...,nkPRINT |
kde n1, n2, ..., nk jsou čísla vybraných příspěvků.
Příkazy pro vyhledávání lze zasílat i dávkově pomocí elektronické pošty. Tento způsob je použitelný i mimo BITNET a je často výhodnější rovněž na BITNETovém uzlu, protože neblokuje terminál. Jako příklad může posloužit následují dávka, uložená po jménem DD TXT na stejných discích jako program LDBASE (viz výše):
// JOB Echo=No |
Tuto dávku stačí pouze modifikovat (případně přidat příkaz PRINT) a poslat LISTSERVu4. U dávkového zpracování se nepoužívá SENDBACK před INDEX a PRINT (všechny výsledky jsou zasílány poštou).
Starší části archivů některých diskusních skupin nejsou zcela v pořádku - někdy se po zadání dotazu objeví zpráva
Internal error 100 while calling LSVDBS, search cancelled. |
V takovém případě stačí omezit hledání na novější příspěvky, např.:
SEARCH ... SINCE Oct 90 |
Zatím jednoznačně nejpoužívanější síťovou službu na naší univerzitě představují přenosy souborů z archivu Simtel20, zajišťované pomocí distribuovaných souborových serverů TRICKLE na některých BITNETových uzlech.
Popis příkazů pro TRICKLE lze získat například zasláním příkazu
/HELP |
na adresu trickle@awiwuw11. Příkaz
/PDGET < adresář> jméno_souboru |
zadává požadavek na přenos daného souboru.
Příkazy pro TRICKLE jsou z BITNETových uzlů zasílány zpravidla interaktivně:
tell trickle at awiwuw11 příkaz_pro_TRICKLE |
Z univerzitní TCP/IP sítě se požadavky posílají poštou (došlé soubory je pak nutno uudecodovat - viz [2] ).
Seznam všech DOSovkých souborů dostupných na Simtelu je uložen v adresáři
NETS
serveru Token-Ringu na Burešově 20 pod jménem SIMIBM.LST
. Tento soubor
je ve tvaru vhodném pro čtení i pro vyhledávání pomocí programu grep
- viz [1]. Lze si jej
nakopírovat u služby v terminálovně v přízemí na Burešově.
Mnoho důležitých dat se nachází v síti
Internet5, která je
z BITNETu dostupná jen zprostředkovaně. Nejdůležitější v tomto ohledu
je server BITFTP@PUCC, který přijímá dávky pro přenosy souborů pomocí
ftp
6. Například dávka
ftp ftp.nisc.sri.com |
zajistí výpis adresáře /pub uzlu ftp.nisc.sri.com a přenos souboru ls-lR
v bináním tvaru; soubor je zaslán pod jménem NISC DIR
.
Hledání souborů pouze pomocí ftp
je značně zdlouhavé a nemusí vést
k úspěchu vzhledem k velkému počtu Internetových uzlů. Zcela novou kvalitu
v tomto směru představují Archie servery, které jsou v provozu
na několika Internetových uzlech. Archie servery pravidelně monitorují
veřejně dostupné adresáře několika set nejdůležitějších Internetových souborových
serverů.
Návod k použití Archie serveru lze získat zasláním zprávy, v níž jako "Subject:" uvedeme
help |
na adresu archie@csmcgillca. Archie servery jsou dostupné i z univerzitní TCP/IP sítě.
[1] | P. Mejzlík.
On-line informace o sítích.
Zpravodaj II/2, str 7.
... zpět do textu |
[2] | P. Mejzlík. Přenosy souborů v sítích.
Zpravodaj II/1, str. 3-5.
... zpět do textu |
[3] | P. Mejzlík. Zapojení univerzity do mezinárodních sítí.
Zpravodaj I/3, str. 10-11.
... zpět do textu |
[4] | J. Zlatuška. Elektronická pošta.
Zpravodaj II/2, str. 3-5.
... zpět do textu |
1 | Jedinou výjimkou je komunikace se serverem BITFTP,
určeným pro přenosy souborů z Internetu. Tento server
funguje pouze pro BITNETové uzly.
... zpět do textu |
2 | Tento soubor je uložen v adresáři NETS serveru Token-Ringu
na Burešově 20 pod jménem listdb.hlp .
... zpět do textu |
3 | INDEX a PRINT implicitně používají ke komunikaci
interaktivní zprávy, které mají v síti "přednost", takže
jejich neúměrné používání by mohlo vést k zahlcení sítě.
... zpět do textu |
4 | Vkládání textového souboru do odesílané po3ty jak ve VM,
tak i v UNIXu je popsáno v [2].
... zpět do textu |
5 | Připojení naší univerzity do Internetu se předpokládá do konce
tohoto roku.
... zpět do textu |
6 | Příkazy pro ftp jsou popsány v [2].
... zpět do textu |