Google #Searching (1): První trik pro lepší vyhledávání

1
4737

Tímto článkem začínáme seriál o lepším, přesnějším a mnohem účinnějším vyhledávání na předním světovém vyhledávači Google, ale nejen na něm. Metody, které si nyní budeme představovat, patří k těm pokročilým. A jelikož se naše informační gramotnost musí zlepšovat každý den, není nic lepšího než si nyní vyzkoušet dobré vyhledávací praktiky na tom nejdostupnějším nástroji.

Google lze označit za typického (a zároveň skvělého) představitele povrchového webu (o tom, co je povrchový web více zde). Mimo samotné vyhledávání tvoří a zpřístupňuje mnoho dalších webových nástrojů, které využívá prakticky nekonečné množství dat.  A že jich nemá málo, je vidět třeba zde.

Eliminujeme informační odpad

Pokud se nyní budeme zabývat hlavním produktem, Google vyhledáváním, pak si řekněme něco málo informací o vztahu přesnosti a úplnosti.

Přesnost = Míra počtu vyhledaných relevantních dokumentů vůči všem vyhledaným dokumentům.

Úplnost = Míra počtu vyhledaných relevantních dokumentů vůči všem dokumentům (např.
existujících v databázi)

Pokud tedy hodláme mít v množině výsledků výhradně relevantní dokumenty, musíme položit dotaz v co možná nejkonkrétnější formě. V druhém případě nám jde o to, abychom získali maximálně možný počet dokumentů v daném vyhledávaném tématu i s rizikem snížení relevance některých vyhledaných dokumentů. Následující postupy navíc mají velký význam pro redukci informačního odpadu, kterého je v rámci povrchového webu opravdu požehnaně. A nyní dva příklady.

Dotaz vedoucí k přesnosti:
"časopis čtenář"

Dotaz vedoucí k úplnosti:
"oborové časopisy" (knihovnictví OR "informační věda")

Nemějte strach, pokud nevíte, proč jsou dotazy napsány takto, vše spolu projdeme do detailu. Rovněž se nepodivujte tomu, proč je časopis Čtenář napsán v dotazu s malým písmenem na začátku. Většina systémů totiž ignoruje velikost písmen. Oba přístupy si nyní ukážeme na Google vyhledávání a rovnou navnímáte jeden ze základní postupů, jak výrazně zefektivnit vaše vyhledávání. Pojďme na to.

Kouzlo fráze nejen v Google

V rámci základního vyhledávání Google nyní prosím zadejte dotaz časopis čtenář bez anglických uvozovek.

Google vyhledávání

Jak sami vidíte, tímto způsobem jste dosáhli mimo prvního relevantního dokumentu ještě dalších stovky tisíc dokumentů. Je to proto, že Google vyhledal všechny dokumenty, které obsahují slova časopis A(!!!!) čtenář. Jednoduše tedy mohl najít mimo časopis Čtenář také webovou stránku, která pojednává o tom, že čtenáři panu Novákovi se líbil časopis Pevnost. To už se známým knihovnickým periodikem nemá nic společného. Google ale takto za vás nepřemýšlí. Vy určujete, jaké výsledky budete dostávat. Každopádně takto zadaný dotaz říká, že obě slova musí být součástí dokumentu.

Proto se podívejme na další příklad, který už nás přesune do jiné roviny výsledků. Zapište nyní do vyhledávacího pole "časopis čtenář", tedy s anglickými uvozovkami. Počet výsledků se radikálně snížil. Čím to?

Google vyhledávání

V Google vyhledávání jsme totiž využili hledání metodou "fráze". Její princip je velmi jednoduchý: Cokoli umístíte do anglických uvozovek bude vyhledáno tak, jak je v nich zapsáno. Tj. v našem případě časopisu Čtenář vrátí systém výsledky dokumentů, které musí někde ve své části obsahovat frázi "časopis čtenář". Vyhledávání s pomocí fráze výrazně zpřesňuje vyhledávání.

Nyní si analyzujme příklad vztažený k úplnosti vyhledávání. Zadejte si do vyhledávacího pole daný dotaz: "oborové časopisy" (knihovnictví OR "informační věda")

Google vyhledáv
Skladba klíčových slov s využitím závorek pro vytvoření logického celku.

U první části "oborové časopisy" již určitě dokážete odhadnout, jak k nim bude systém (Google) přistupovat. Ano, bude vyhledávat přesně tuto frázi.   Ale co ona druhá část (knihovnictví OR "informační věda")? Závorka nám vytváří logický celek složený ze dvou částí – knihovnictví NEBO(OR)!!!! informační vědy. To znamená, že Google bude vyhledávat v dokumentu buď slovo knihovnictví NEBO(OR) frázi "informační věda".

Celý dotaz potom bude v rámci Google přeložen do přirozeného jazyka následovně: Vyhledej frázi "oborové časopisy" společně buď s klíčovým slovem knihovnictví nebo s frází "informační věda" nebo s oběma najednou.

Z téměř 160 výsledků můžeme vidět některé velmi relevantní – tedy přehled oborových periodik se zaměřením na knihovnictví či informační vědu. Navíc jsme dokázali maximalizovat vztah úplnosti a přesnosti vyhledávání. V nalezených dokumentech nalezneme nejenom informaci o existenci časopisu Čtenář, ale i o dalších desítkách zdrojů z podobné oblasti.

Shrnutí:

  • Přesnost je míra počtu vyhledaných relevantních dokumentů vůči všem vyhledaným dokumentům.
  • Úplnost je míra počtu vyhledaných relevantních dokumentů vůči všem dokumentům (např. existujících v databázi)
  • Vyhledávání pomocí „fráze“ je základním nástrojem pro přesnější a efektivnější vyhledávání.

1 komentář

ZANECHTE ZPRÁVU

Prosím vložte komentář!
Prosím zadejte jméno