Adresáře neviditelného webu

Text dotazu

Dobrý den,
rád bych se vás zeptal, jaké jsou,nebo co znamenají "adresáře neviditelného webu", popř. konkrétní příklady.
Děkuji mnohokrát

Odpověď

Dobrý den,

k Vašemu dotazu si dovolujeme odcitovat část prezentace Vyhledávání informací ve webovském rozhraní.

 

Mgr. Věra Pilecká, PhDr. Richard Papík, Ph.D. Elektronické informační zdroje. In: Pražská síť podpory elektronického vzdělávání [online]. 2006-2008 [cit. 2019-05-07]

 

Vyhledávání informací ve webovském rozhraní - Viditelný a neviditelný web

               

Kromě veřejně přístupných a indexovatelných webových dokumentů síť internet umožňuje přístup k obrovskému množství dalších informací, pro něž se vžil termín neviditelný (invisible) nebo také hluboký web (deep web).

Pro vyhledávání v oblasti internetu je stěžejní, které vyhledávací nástroje s jakými možnostmi využíváme - zda zahrnují pouze zdroje volně přístupné a snadno vyhledatelné nebo naopak i zdroje vyhledatelné obtížně, tzn. zda se vyhledávací nástroje při indexování webu zaměřují na oblast viditelného nebo neviditelného webu.

               

Povrchový nebo také viditelný web (surface web, visible web) obsahuje dokumenty, které jsou běžně volně přístupné a snadno vyhledatelné vyhledávacími stroji.

Pojem neviditelný web zahrnuje internetové informační zdroje, které jsou běžnými vyhledávacími stroji obtížně vyhledatelné - tyto zdroje jsou pro ně totiž "neviditelné". Může se jednat o informace, které jsou uloženy v databázích a generují se dynamicky až na základě interakce uživatele se systémem (např. online katalogy knihoven nebo bibliografické báze dat, kalkulátory; cca 54 % deep webu) nebo o informace, ke kterým je přístup chráněn heslem a jsou dostupné pouze autorizovaným uživatelům, často pouze na komerční bázi (plné texty časopisů apod.), adresáře, specializované vyhledávače, dokumenty v jiných formátech než HTML (např. PDF, PS, Macromedia Flesh - v těchto formátech se často publikují výzkumné zprávy a studie, příspěvky z konferencí, oficiální zprávy a další významné dokumenty) nebo stránky "samotáře", ze kterých není odkaz na jiné a na které není odkaz. Odhaduje se, že množství dokumentů v oblasti neviditelného webu je 500krát větší než na webu viditelném.

Běžné vyhledávací stroje nemohou ve svých databázích registrovat informace z oblasti hlubokého webu, buď pro technická omezení nebo proto, že je jejich robotům vstup do těchto zdrojů zakázán. Vyhledávací služby sice poskytnou informaci o existenci podobného informačního zdroje, ale nevyhledají informace, které jsou v něm obsaženy. Existují specializované vyhledávací služby [ev. adresáře], které umožňují prohledávání neviditelného webu, např. Complete Planet, Direct Search, Scirus.

 

Aktuálně např:

Direct Search - http://www.directsearch.net/DS/index.html

CiteSeerX - https://citeseerx.ist.psu.edu/index;jsessionid=43B4727525D12DBAD86744A5A9ED55E0

Google Scholar - https://scholar.google.cz/ Archive.org - https://archive.org/

 

Obor

Knihovnictví, informatika, všeobecné, referenční literatura

Okres

--

Knihovna

Národní knihovna ČR

Datum zadání dotazu

07.05.2019 16:23

Přidat komentář

Pokud chcete přidat komentář, zadejte jej do formuláře níže. Nejsou povoleny žádné formátovací značky. Adresy na web nebo emailové adresy budou automaticky transformovány na aktivní odkazy. Komentáře jsou moderovány.

Zapište číslici "pět".

Hledání v archivu