\"/
\"/ \"/    

Jak vytáhnout informace z počítačových sítí

Petr Mejzlík, ÚVT MU
Ročník II - číslo 3, leden 1992
Citace: P. Mejzlík. Jak vytáhnout informace z počítačových sítí. Zpravodaj ÚVT MU. ISSN 1212-0901, 1992, roč. II, č. 3, s. 3-5.
Tematické zařazení: Počítačové sítě obecně
 předchozí článek | následující článek 

Úvod

V počítačových sítích se již řadu let hromadí znalosti z nejrůznějších oborů. Stejně jako u jiných zdrojů informací je i u počítačových sítí velmi důležitá schopnost informace v nich efektivně vyhledávat.

Odkazy na faktografické materiály (soubory) k mezinárodním počítačovým sítím lze najít v [1]. V tomto článku půjde spíše o obecné strategie, které se osvědčily během dosavadní praxe.

Všechny zde popsané postupy lze použít na BITNETových uzlech. Téměř stejné možnosti1 mají i uživatelé univerzitní TCP/IP sítě, pouze musejí příkazy pro servery zasílat elektronickou poštou, a ne interaktivně, jak je to možné v BITNETu.

Servery LISTSERV

Souborové servery v BITNETu jsou implementovány pomocí programu LISTSERV, rozšířeného na více než 200 uzlech; nejbližší z nich má adresu LISTSERV@CSEARN. Tyto servery zároveň zajišťují distribuci zpráv v BITNETových diskusních skupinách. Stručný přehled příkazů pro LISTSERV lze získat příkazem help, například

     tell listserv at csearn help

Seznam souborů, které obhospodařuje, zasílá LISTSERV na příkaz index. Seznam bývá často hierarchicky členěn, vyskytují se v něm soubory xxx FILELIST, obsahující "podadresáře". Pro zasílání jednotlivých souborů slouží příkaz get, například

     tell listserv at csearn get listserv refcard

BITNETové diskusní skupiny

Stejně zaměření lidé komunikující pomocí počítačových sítí bývají sdruženi v diskusních skupinách (mailing lists). Podstatou diskusních skupin je mechanismus, který rozesílá zprávy od libovolného účastníka všem členům skupiny. Podrobnosti o diskusních skupinách se lze dočíst v [4][3].

U mnoha BITNETových skupin existuje velice užitečná možnost vyhledávání v archivech. Díky této funkci lze z příspěvků dosud zaslaných do diskusní skupiny efektivně vybrat ty, které se týkají tématu, jež nás zajímá. Často se tak podaří získat podstatně úplnější informaci než při přímém dotazu zaslaném do skupiny.

K automatizovanému vyhledávání v archivech slouží program LDBASE, který je nainstalován na brněnském uzlu CSBRMU11 na disku PUBLIC 191 (tento disk je standardně připojen) i na pražském CSPUNI12 na disku MUSYS 191. Úplný popis funkcí LDBASE je v souboru LISTDB MEMO2, který lze získat například příkazem
tell listserv at csearn get listdb memo
Program LDBASE se spouští příkazem

     LDBASE node

kde node je jméno uzlu, kde se archiv skupiny nachází. Jména archivů a případně jiných databází spravovaných programem LISTSERV na daném uzlu se vypíší příkazem

     tell listserv at node database list

Prvním příkazem po spuštění LDBASE je příkaz SEARCH, zadávaný zpravidla ve tvaru

     SEARCH podmínka IN jméno_skupiny SINCE datum

Takto zadaný požadavek vyhledá všechny příspěvky, v jejichž textu se vyskytuje některá z kombinací slov odpovídajících zadané podmínce, přičemž se uvažují jen příspěvky od daného data (není-li zadáno SINCE datum, prohledává se celý archiv). Například

     SEARCH (OS2 or 'OS/2') and (FTP or TCP) in PCIP since 90

vyhledá v diskusní skupině PCIP všechny příspěvky od roku 1990 obsahující "OS2" nebo "OS/2" (na malých/velkých písmenech zde nezáleží) a "FTP" nebo "TCP" (cílem tohoto dotazu je získání informací o TCP/IP pod operačním systémem OS/2).

Příkaz

     INDEX

vypíše seznam příspěvků vybraných posledním příkazem SEARCH, obsahující pro každou položku datum, velikost, téma (Subject) a číslo příspěvku v archivu. Příkaz

     PRINT

vypíše celý text příspěvků vybraných při posledním SEARCH. Příkazy INDEX a PRINT v základní podobě vypisují nejvýše 20 řádků3, což je zejména u PRINTu nedostatečné. Toto omezení lze obejít zadáváním příkazů ve tvaru

     SENDBACK INDEX
SENDBACK PRINT

což zajistí zasílání výsledků elektronickou poštou.

Při rozsáhlejším vyhledávání se osvědčila strategie, kdy je nejdříve vytvořen poměrně rozsáhlý seznam potenciálně zajímavých příspěvků (pomocí SEARCH a INDEX). Z něho jsou pak ručně vyselektovány podle položky Subject: ty nejzajímavější a přímo vytaženy z archivu podle svých

     SEARCH * IN jméno_skupiny.n1,n2,...,nk
PRINT

kde n1, n2, ..., nk jsou čísla vybraných příspěvků.

Příkazy pro vyhledávání lze zasílat i dávkově pomocí elektronické pošty. Tento způsob je použitelný i mimo BITNET a je často výhodnější rovněž na BITNETovém uzlu, protože neblokuje terminál. Jako příklad může posloužit následují dávka, uložená po jménem DD TXT na stejných discích jako program LDBASE (viz výše):

     //      JOB Echo=No
Database Search DD=Rules
//Rules DD   *
search archie in infonets since sept 91
index
/*

Tuto dávku stačí pouze modifikovat (případně přidat příkaz PRINT) a poslat LISTSERVu4. U dávkového zpracování se nepoužívá SENDBACK před INDEX a PRINT (všechny výsledky jsou zasílány poštou).

Starší části archivů některých diskusních skupin nejsou zcela v pořádku - někdy se po zadání dotazu objeví zpráva

     Internal error 100 while calling LSVDBS, search cancelled.

V takovém případě stačí omezit hledání na novější příspěvky, např.:

     SEARCH ... SINCE Oct 90

Soubory ze Simtelu20

Zatím jednoznačně nejpoužívanější síťovou službu na naší univerzitě představují přenosy souborů z archivu Simtel20, zajišťované pomocí distribuovaných souborových serverů TRICKLE na některých BITNETových uzlech.

Popis příkazů pro TRICKLE lze získat například zasláním příkazu

     /HELP

na adresu trickle@awiwuw11. Příkaz

     /PDGET <adresář>jméno_souboru

zadává požadavek na přenos daného souboru.

Příkazy pro TRICKLE jsou z BITNETových uzlů zasílány zpravidla interaktivně:

     tell trickle at awiwuw11 příkaz_pro_TRICKLE

Z univerzitní TCP/IP sítě se požadavky posílají poštou (došlé soubory je pak nutno uudecodovat - viz [2] ).

Seznam všech DOSovkých souborů dostupných na Simtelu je uložen v adresáři NETS serveru Token-Ringu na Burešově 20 pod jménem SIMIBM.LST. Tento soubor je ve tvaru vhodném pro čtení i pro vyhledávání pomocí programu grep - viz [1]. Lze si jej nakopírovat u služby v terminálovně v přízemí na Burešově.

Přenosy souborů z Internetu

Mnoho důležitých dat se nachází v síti Internet5, která je z BITNETu dostupná jen zprostředkovaně. Nejdůležitější v tomto ohledu je server BITFTP@PUCC, který přijímá dávky pro přenosy souborů pomocí ftp6. Například dávka

     ftp ftp.nisc.sri.com
dir pub
binary
get ls-lR nisc.dir

zajistí výpis adresáře /pub uzlu ftp.nisc.sri.com a přenos souboru ls-lR v bináním tvaru; soubor je zaslán pod jménem NISC DIR.

Prohledávání adresářů v Internetu

Hledání souborů pouze pomocí ftp je značně zdlouhavé a nemusí vést k úspěchu vzhledem k velkému počtu Internetových uzlů. Zcela novou kvalitu v tomto směru představují Archie servery, které jsou v provozu na několika Internetových uzlech. Archie servery pravidelně monitorují veřejně dostupné adresáře několika set nejdůležitějších Internetových souborových serverů.

Návod k použití Archie serveru lze získat zasláním zprávy, v níž jako "Subject:" uvedeme

     help

na adresu archie@csteckamcgillteckaca. Archie servery jsou dostupné i z univerzitní TCP/IP sítě.

Literatura

[1] P. Mejzlík. On-line informace o sítích. Zpravodaj II/2, str 7.
... zpět do textu
[2] P. Mejzlík. Přenosy souborů v sítích. Zpravodaj II/1, str. 3-5.
... zpět do textu
[3] P. Mejzlík. Zapojení univerzity do mezinárodních sítí. Zpravodaj I/3, str. 10-11.
... zpět do textu
[4] J. Zlatuška. Elektronická pošta. Zpravodaj II/2, str. 3-5.
... zpět do textu
setting
1 Jedinou výjimkou je komunikace se serverem BITFTP, určeným pro přenosy souborů z Internetu. Tento server funguje pouze pro BITNETové uzly.
... zpět do textu
2 Tento soubor je uložen v adresáři NETS serveru Token-Ringu na Burešově 20 pod jménem listdb.hlp.
... zpět do textu
3 INDEX a PRINT implicitně používají ke komunikaci interaktivní zprávy, které mají v síti "přednost", takže jejich neúměrné používání by mohlo vést k zahlcení sítě.
... zpět do textu
4 Vkládání textového souboru do odesílané po3ty jak ve VM, tak i v UNIXu je popsáno v [2].
... zpět do textu
5 Připojení naší univerzity do Internetu se předpokládá do konce tohoto roku.
... zpět do textu
6 Příkazy pro ftp jsou popsány v [2].
... zpět do textu
Zpět na začátek
ÚVT MU, poslední změna 14.11.2011