Pátek, 16 května, 2025
Domů Blog Stránka 14

ECDC. Digitální brána pro prevenci a kontrolu nemocí v Evropě

0
woman in white long sleeve shirt sitting on chair

Úvodní představení

Evropské středisko pro prevenci a kontrolu nemocí, zkratka ECDC, je jednou z 68 institucí a orgánů Evropské unie (European Commission 2021). Oficiálně funguje od května roku 2005 a sídlí v hlavním městu Švédska – Stockholmu. ECDC je zaměřené na obranu proti infekčním chorobám v rámci EU (ECDC 2021a). Mezi hlavní funkce ECDC patří:

  • Dohled nad epidemiologickou situací a příprava možných reakcí na její změny
  • Epidemiologické zpravodajství
  • Vědecké poradenství
  • Činnost v oblasti mikrobiologie
  • Školení v oblasti veřejného zdraví
  • Zdravotnická komunikace, včetně mezinárodní zdravotnické komunikace
  • Publikování vědeckého časopisu Eurosurveillance (odborný recenzovaný časopis vydávaný od roku 2007)

Portál ECDC

Agentura ECDC provozuje portál https://www.ecdc.europa.eu/, který je hlavním objektem zkoumání tohoto článku. Portál obsahuje tematické datasety a publikace týkající se veřejného zdraví nejen v EU. Na portálu jsou také dostupné nástroje, za jejichž pomoci si uživatelé mohou data jednoduše vizualizovat dle předpřipravených scénářů. Vzhledem k tomu, že hlavním zaměřením portálu je veřejné zdraví, je vhodné doplnit přesnější soupis toho, jaká konkrétní data a informace portál poskytuje.

To, jaká data a informace portál poskytuje, v podstatě kopíruje program zaměření operační jednotky ECDC pro choroby, který primárně monitoruje situaci:

  • Antimikrobiální rezistence a infekcí spojené se zdravotní péčí
  • Vznikajících onemocnění a onemocnění přenášené vektory
  • Nemocí přenášených potravinami, vodou a zoonózy (infekce přirozeně přenosné mezi zvířaty a lidmi)
  • HIV, pohlavně přenosných infekcí a virové hepatitidy
  • Chřipky a dalších respirační virů
  • Tuberkulózy
  • Nemocí, kterým lze předcházet očkováním

Další kapitoly článku budou věnovány představení struktury portálu ECDC a podrobnějšímu popisu informací a dat dostupných na tomto portálu.

Možnosti vyhledávání

Možnosti vyhledávání na portálu ECDC nejsou příliš široké. Na portálu je možné vyhledávat klasicky dle klíčových slov, nicméně nikde není žádná zmínka o tom, zda ve vyhledávači lze používat operátory (např. AND, OR nebo NOT). Jedinou možností, jakým způsobem může uživatel filtrovat výsledky vyhledávání, je volba vyhledávat klíčové články mezi příspěvky týkajících se dat, událostí, novinek nebo publikací.

Obrázek 1 Hlavní vyhledávač portálu ECDC (ECDC 2021e)

Druhou možností vyhledávání na portále je vyhledávač dle témat, který je dostupný v části All topics: A to Z. Zde lze, stejně jako v předchozím vyhledávači, vyhledávat dle klíčových slov. Na stránce je nicméně dostupný také seznam všech témat, která jsou ECDC sledována. V seznamu všech témat se lze také pohybovat za pomoci prvních písmen názvů témat, která jsou umístěna přímo pod vyhledávačem, a po kliknutí na konkrétní počáteční písmeno nás přesměrují k tématům začínajícím na toto písmeno. Naprostá většina témat je věnována onemocněním (jedno téma je věnováno jednomu onemocnění nebo jednomu typu onemocnění) a vakcinaci.

Obrázek 2 Vyhledávač v sekci All topics: A to Z (ECDC 2021b)

Struktura portálu

Portál ECDC je členěn do čtyř sekcí:

  • Newsroom
  • Publications & Data
  • Tools
  • About us

Toto členění zahrnuje všechna jednotlivá témata, která jsou na portálu dostupná v části All topics: A to Z. To znamená, že ve všech těchto sekcích lze nalézt informace, data nebo nástroje související se všemi jednotlivými onemocněními a tématy vakcinace, které ECDC sleduje. Výjimkou je sekce About us, která je věnována představení organizace ECDC.

Sekce

V další části textu bude každá ze sekcí blíže popsána.

Newsroom

Sekce Newsroom je věnována všem novinkám v oblastech, kterými se ECDC zabývá. Samotná stránka sekce Newsroom je členěna do 3 částí. Část Latest news obsahuje nejnovější informace o epidemiologické situaci v EU a odkazy na nejaktuálnější reporty či souhrny. Jak je vidět na obrázku 3, 12.12.2021 byla například část Latest news věnována nejnovější hrozbě, kterou je mutace COVID-19 s názvem Omicron. Hlavní částí sekce Newsroom je ovšem část Featured (vybraný obsah). Ta je věnována výhradně nejaktuálnějším vizualizacím a nástrojům dostupným na portálu ECDC. Příklady můžete vidět na obrázku 3.

Obrázek 3 Sekce Newsroom (ECDC 2021f)

Další částí Newsroom sekce ECDC je zobrazení aktuální situace u sledovaných jevů. V případě této sekce jsou často zobrazeny jevy (ve většině onemocnění), které se vyskytují i mimo EU. ECDC totiž nemonitoruje výhradně jen území Evropské unie, ale také některé další země Evropského hospodářského prostoru (zkratka EEA), mezi které patří například Norsko. Dále je úkolem ECDC také monitorovat situaci ohledně hrozeb, které ještě nejsou evidovány na území EU, ale jejich výskyt v ostatních okolních zemích i na jiných kontinentech může být pro země Evropské unie rizikem.

Publications & Data

Tato sekce je opět členěna do tří částí. Stejně jako v případě sekce Newsroom je zde k dispozici část vyčleněná vybranému obsahu. Dále se zde ale nacházejí pro nás zajímavé části Latest publications (nejnovější publikace) a Latest data (nejnovější dat), jak je možno vidět na obrázku 4.

Obrázek 4 Sekce Publikace a data (ECDC 2021g)

Publikace poskytuje ECDC v naprosté většině ve formátu pdf. Publikace se většinou týkají jednoho konkrétního tématu a poskytují zájemcům kompletní souhrn o daném tématu, včetně odkazů na použité datové zdroje, postupu sběru i zpracování dat a metody vypracování zprávy.

Datasety

Datasety, které ECDC uživatelům nabízí, jsou opět členěny dle konkrétního tématu, a v naprosté většině jsou dostupné ve všech z následujících datových formátů:

  • xlsx
  • csv
  • json
  • xml

Část datasetů, které jsou periodicky aktualizovány (např. denní přírůstek nakažených nemocí COVID-19), je také možné stahovat strojově, z linků uvedených v popisu datasetu. Popis datasetu zachycuje obrázek 5. Popis datasetů obsahuje také souhrn s metadaty datasetů, což výrazně usnadňuje orientaci a práci s datasety.

Obrázek 5 Popis datasetu s počtem nových případů nakažených osob onemocněním COVID-19 a počtem úmrtí osob souvisejícím s tímto onemocněním (ECDC 2021d)

Tools

Sekce ve své horní části zobrazuje klíčové nástroje, kterým v současné době celkem logicky vévodí nástroj pro sledování vakcinace proti onemocnění COVID-19.

Obrázek 6 Sekce Tools portálu ECDC (ECDC 2021h)

Sekce věnovaná nástrojům nabízí také rozcestník k nástrojům s informacemi a daty k onemocněním, očkování nebo například i k veřejným školením týkajících se zdravotních témat. Tato sekce obsahuje dva rozcestníky. Jeden členěný dle jednotlivých onemocnění či jejich typů (zobrazený na obrázku 7) a druhý dle tématu (obrázek 8).

Obrázek 7 Rozcestník dle onemocnění a jejich typů v sekci Tools (ECDC 2021h)
Obrázek 8 Rozcestník dle témat v sekci Tools (ECDC 2021h)

About us

Sekce About us na portálu ECDC je věnována informacím o aktivitách ECDC. Obsahuje rozcestník s odkazy například na popis mise organizace, strukturu organizace, způsob fungování organizace nebo informace o financování organizace.

Představení konkrétního nástroje

Nástrojů, které portál ECDC poskytuje, je větší množství (přinejmenším desítky). Další část článku bude proto věnována představení jednoho konkrétního nástroje. Pro představení byl vybrán nástroj COVID-19 Vaccine tracker, který může uživatelům poskytnout zásadní informace k aktuální situaci.

V podstatě se jedná o souhrnný dashboard se zaměřením na vizualizaci dat, která se týkají vakcinace proti onemocnění COVID-19 v Evropské unii. Dashboard se skládá z několika částí. Každé z těchto částí bude věnována jedna následující podkapitola.

Key Figures

Část Key Figures poskytuje uživatelům základní souhrn nejdůležitějších informací týkajících se vakcinace proti onemocnění COVID-19 v tabulární podobě. Tento souhrn lze zobrazit pro všechny monitorované státy v rámci EU/EEA a také pro každý z monitorovaných států zvlášť.

Další možností zobrazení je pohled do minulosti. Všechna data lze zobrazit dle týdne v kalendářním roce. Historie sahá až do 50 týdne roku 2020.

Přepínači na pravé straně obrazovky lze rychle změnit pohled na souhrnnou tabulku. Možnost Country Figures zobrazí tabulku členěnou dle všech států (jeden stát jeden řádek). K souhrnné tabulce se lze opět vrátit za pomoci toho samého tlačítka, jelikož se vždy po stisknutí změní, aby se bylo možné vrátit na předchozí pohled. Celkem existují tedy dva stavy tohoto tlačítka – Summary figures a Country figures. V této části je ještě jeden přepínač, kterým lze omezit výběr zemí pouze na země EU, nebo na země EU a zároveň i země EEA.

Obrázek 9 COVID-19 Vaccine tracker – část Key Figures (ECDC 2021c)

Vaccine Uptake

Část Vaccine Uptake je postavena na stejných datech, jako část Key Figures, zobrazuje je ovšem za pomoci vizuálů v podobě mapy, grafů a KPI (v horní části dashboardu). Filtry jsou velice podobné předchozí sekci, navíc je ovšem dostupný přepínač pro omezení věku s dvěma možnostmi. Jednou pro zobrazení celé populace a druhou pro zobrazení pouze dospělé populace (data o osobách starších 18 let).

Obrázek 10 COVID-19 Vaccine tracker – část Vaccine Uptake (ECDC 2021c)

Mapa zobrazená v této části dashboardu je interaktivní. Filtrem s názvem Indicator lze ovládat metriky zobrazené v mapě (ostatní vizuály v této části dashboardu filtr neovlivňuje). K dispozici jsou následující možnosti:

  • Vakcinace alespoň jednou dávkou (v procentuálním vyjádření k celkové populaci)
  • Plná vakcinace (v procentuálním vyjádření k celkové populaci)
  • Vakcinace posilující dávkou (v procentuálním vyjádření k celkové populaci)
  • Celkový počet osob očkovaných první dávkou vakcíny
  • Celkový počet plně očkovaných osob
  • Celkový počet osob očkovaných posilující dávkou vakcíny
Obrázek 11 Filtr Indicator v části Vaccine Uptake COVID-19 Vaccine Trackeru (ECDC 2021c)

Dle volby výše zvolené metriky pak lze po najetí myší na konkrétní zemi v mapě zobrazit souhrnné informace pro danou zemi.

Obrázek 12 Vizualizace mapy Evropy v části Vaccine Uptake COVID-19 Vaccine Trackeru (ECDC 2021c)

Target Groups

Další část COVID-19 Vaccine trackeru je věnována souhrnu vakcinace dle skupin obyvatelstva. Celkem na tomto dashboardu jsou určeny 3 skupiny obyvatelstva, pro které lze data zobrazit:

  • Osoby starší 60 let
  • Pracovníci ve zdravotnictví
  • Osoby v pečovatelských domovech, domovech pro seniory a dalších zařízeních s podobnou povahou
Obrázek 13 COVID-19 Vaccine tracker – část Target Groups (ECDC 2021c)

I v této části dashboardu lze opět filtrovat data pro EU nebo EU/EEA. Dále také lze omezit zobrazená data pro jednu konkrétní zemi. Na rozdíl od části Vaccine Uptake v této části filtr s názvem Indicator ovlivňuje většinu z vizualizací (ne pouze mapu).

Age Groups

Část Age Groups je věnována zobrazení dat dle věkových skupin obyvatelstva. Data jsou zobrazována dle následujících věkových kategorií:

  • 60 a více let
  • 50-59 let
  • 25-49 let
  • 18-24 let
  • Méně než 18 let

V liniovém grafu a v tabulce je navíc kategorie do 18 let rozdělena na:

  • 15-17 let
  • 10-14 let
  • 5-9 let
  • 0-4 roky
Obrázek 14 Část Age Groups COVID-19 Vaccine Trackeru (ECDC 2021c)

Doses by Product

Další část nástroje COVID-19 Vaccine Tracker je zaměřena na rozdělení vakcín dle jednotlivých výrobců. Filtr Indicator je v této části Vaccine Trackeru pozměněný. Obsahuje pouze 3 možnosti:

  • Distribuované dávky na 100 obyvatel
  • Celkový počet distribuovaných dávek
  • Celkový počet podaných dávek

V rámci této části dashboardu ovlivňuje filtr Indicator všechny vizualizace.

Obrázek 15 Filtr Indicator v části Doses By Product COVID-19 Vaccine Trackeru (ECDC 2021c)

Část Doses By Product tedy není zajímavá jen z pohledu epidemiologického. Je na ni dobře možné sledovat, které vakcíny mají v Evropě největší úspěch.

Obrázek 16 část Doses By Product v COVID-19 Vaccine Trackeru (ECDC 2021c)

Country Profiles

Předposlední části je část věnovaná profilům jednotlivých monitorovaných zemí. Z pohledu samotných vizualizací a jejich datového obsahu je pravděpodobně nejméně zajímavá. Obsahuje ovšem užitečné odkazy na webové portály s daty o vakcinaci a se strategií vakcinace konkrétní zobrazené země. Na obrázku níže, kde je zobrazen profil ČR, se odkazy nachází na pravé straně a uživatele odkazují přímo na dokument Národní strategie očkování proti nemoci COVID-19 a na web Ministerstva zdravotnictví ČR s daty o očkování v ČR (MZČR 2020, MZČR 2021).

Toto zobrazení funguje analogicky pro všechny země, které je možné v této části dashboardu zvolit.

Obrázek 17 Country profiles v rámci COVID-19 Vaccine Trackeru (ECDC 2021c)

Notes on the data

Část Notes on the data (česky – poznámky k datům) obsahuje informace ohledně účelu nástroje COVID-19 Vaccine Tracker a podkladových dat. V této části jsou dostupné také odkazy na podkladová data z dashboardů, která je možná stáhnout pro další analýzy (dostupný rozcestník obsahuje odkazy nejen na data o vakcinaci, ale také odkazy na data týkající se například onemocněními COVID-19 nebo úmrtností spojenou s COVID-19).

Důležitou součástí poznámek k datům je také vizualizace věnovaná konzistenci dat zobrazených ve vizualizacích. Z ukázky na obrázku je možné vidět, že například Česká republika začala v 16. týdnu toho kalendářního roku reportovat data o vakcinaci věkové skupiny 10 až 14 let. Z vizualizace je také vidět, že Česká republika poskytuje data ohledně věkové skupiny starších 60 let v podrobnějším rozdělení, tedy rozdělená do dalších kategorií:

  • 60-69 let
  • 70-79 let
  • 80 a více let
Obrázek 18 Vizualizace reportovaných dat jednotlivými zeměmi v části věnované poznámkám k datům v COVID-19 Vaccine Trackeru (ECDC 2021c)

Přístup k datům a informacím

ECDC si zakládá na tom, aby publikovaná data v rámci jejich portálu byla veřejně dostupná. Žádné licenční ani jednorázové poplatky uživatelé platit nemusí. Přístup je zdarma. A to jak k jednotlivým datasetům a nástrojům, tak i k publikovaným reportům a souhrnům.

Zdroje

ECDC, 2021a. About ECDC. European Centre for Disease Prevention and Control [online] [vid. 2021-12-05]. Dostupné z: https://www.ecdc.europa.eu/en/about-ecdc

ECDC, 2021b. All topics: A to Z. European Centre for Disease Prevention and Control [online] [vid. 2021-12-12]. Dostupné z: https://www.ecdc.europa.eu/en/all-topics

ECDC, 2021c. COVID-19 Vaccine Tracker | European Centre for Disease Prevention and Control [online] [vid. 2021-12-08]. Dostupné z: https://vaccinetracker.ecdc.europa.eu/public/extensions/COVID-19/vaccine-tracker.html#uptake-tab

ECDC, 2021d. Data on the daily number of new reported COVID-19 cases and deaths by EU/EEA country. European Centre for Disease Prevention and Control [online] [vid. 2021-12-08]. Dostupné z: https://www.ecdc.europa.eu/en/publications-data/data-daily-new-cases-covid-19-eueea-country

ECDC, 2021e. Homepage | European Centre for Disease Prevention and Control [online] [vid. 2021-12-08]. Dostupné z: https://www.ecdc.europa.eu/en

ECDC, 2021f. Newsroom. European Centre for Disease Prevention and Control [online] [vid. 2021-12-08]. Dostupné z: https://www.ecdc.europa.eu/en/news-events

ECDC, 2021g. Publications and data. European Centre for Disease Prevention and Control [online] [vid. 2021-12-08]. Dostupné z: https://www.ecdc.europa.eu/en/publications-data

ECDC, 2021h. Tools. European Centre for Disease Prevention and Control [online] [vid. 2021-12-12]. Dostupné z: https://www.ecdc.europa.eu/en/data-tools

EUROPEAN COMMISSION, 2021. Institutions and bodies profiles. European Union [online]. B.m.: European Commission – Directorate-General for Communication [vid. 2021-12-05]. Dostupné z: https://european-union.europa.eu/institutions-law-budget/institutions-and-bodies/institutions-and-bodies-profiles_en

MZČR, 2020. NÁRODNÍ STRATEGIE OČKOVÁNÍ PROTI NEMOCI COVID-19 [online]. 7. září 2020. Dostupné z: https://www.mzcr.cz/wp-content/uploads/2020/09/N%C3%A1rodn%C3%AD-vakcina%C4%8Dn%C3%AD-strategie-onemocn%C4%9Bn%C3%AD-covid-19_k-ve%C5%99ejn%C3%A9-diskusi.pdf

MZČR, 2021. COVID‑19: Přehled vykázaných očkování v ČR | Onemocnění Aktuálně MZČR. onemocneni-aktualne.mzcr.cz [online] [vid. 2021-12-12]. Dostupné z: https://onemocneni-aktualne.mzcr.cz/vakcinace-cr

Náhledový obrázek – „Syringe and Vaccine“ by NIAID is licensed under CC BY 2.0

Taylor & Francis Online

0
person holding folders

Úvod

Obrázek 1: Logo Skupiny Taylor & Francis, zdroj: https://taylorandfrancis.com/about/our-brands

Taylor & Francis Online je informační služba, poskytovaná společností (skupinou) Taylor & Francis Group, která sama patří pod společnost Informa UK Limited.

Throughout Informa, in every market and Informa business, we share the same purpose: to champion the specialist, connecting people with knowledge to help them learn more, know more and do more.“ (Informa PLC, 2021 a, část Purpose & Principles).

Informa je mezinárodní zpravodajská, informační, událostní, vědecká a výzkumná skupina pocházející z Velké Británie. Jejími cíli je (obdobně jako u podobných informačních služeb) šíření znalostí a materiálů, zviditelňování specialistů, snižovaní znalostních bariér a mnoho dalších (Informa PLC, 2021 b). Těchto cílů dosahuje mnoha způsoby a jedním z nich je skupina Taylor & Francis a její služba Taylor & Francis Online.

Samotná společnost Taylor & Francis vznikla již v roce 1852 (ale některé kořeny sahají až do 1798). Od svého vzniku se stále snaží naplňovat svou misi „publikovat co nejkvalitnější akademický výzkum“ (autorský překlad). V roce 2004 se společnost sloučila s firmou Informa, pod kterou funguje do dnes.

O knihovně

Taylor & Francis Online je webová knihovna, umožňující návštěvníkům vyhledávat studie, články, výzkumná data, reporty či jinou literaturu z různých oblastí a témat, autorům sdílet své výtvory, nechat je podstoupit „peer review“ a následně je na webu publikovat a dalším lidem, jako např. editorům a knihovníkům, poskytuje funkce pro usnadnění jejich práce či pro získávání a zajišťování kvalitních dat a literatury (Informa PLC, 2021 c).

Knihovna dnes obsahuje přes 4 680 000 článků ve stovkách různých kategoriích a poskytuje k nim mnoho funkcí a služeb, které budou rozebrány v následujících kapitolách.

Možnosti vyhledávání

Je možné vyhledávání v několika formách. První z nich je obyčejné vyhledávání zadáním několika klíčových slov (tzv. quick search). Druhé, důležitější, je advanced search, ve kterém může uživatel specifikovat parametry, jako např rok vydání, téma, abstrakt atd. za použití logických operátorů. Dalším způsobem vyhledávání je vyhledávání dle tématu, kde uživatel vybere z nabídky témat a výsledky může dále filtrovat a posledním způsobem jsou vyhledávání dle časopisu (journal), či různé žebříčky. Každý způsob je sám rozebrán v podkapitole.

Quick search

Obrázek 2: Příklad quick search, zdroj: https://taylorandfrancis.com/about/our-brands/

Quick search je nejzákladnější a nejjednodušší způsob vyhledávání. Jak jsme zvyklí i v jiných vyhledávačích, stačí zadat hledané slovo a vyhledávač vrátí všechny články, které obsahují dané slovo v názvu, poli autora, abstraktu, obsahu atd. Výstřižek výsledků vrácených na vstup „covid“ jsou na Obrázek 2. Dané výsledky je možné dále ještě filtrovat, a to pomocí nabídek na liště, kde je možné vybrat například výsledky mladší jak rok, výsledky, ke kterým mám přístup nebo pouze články určité kategorie či vydavatele. Je zde i možné specifikovat, kde by se daná hledaná slova měla nacházet (kdekoliv, nadpis, autor, keywords atd.).

Výsledky je možné si exportovat do excel dokumentu, nebo si stáhnout full-text PDF soubory všech výsledků přímo z menu (pro tyto funkce je ale nutný uživatelský účet).

Advanced search

Obrázek 3: Advanced Search, zdroj: https://www.tandfonline.com/search/advanced

Advanced search je, jak název napovídá, vyhledávání za pomoci pokročilých parametrů. Je možné zadat několik slov pro vyhledávání v různých částech dokumentu (např. zadat jméno autora a hledaného díla), určit, z jakého období chceme výsledky, případně je i možné použít hledání z citace.

Všechna textová pole zároveň poskytují možnost užití boolean operátorů AND, OR a NOT, díky kterým je možné přesněji určit hledané dokumenty. AND slouží k vyhledání dokumentů obsahující obě zadaná slova. Např. v případě hledání Adam AND Eva se vyhledávač pokusí najít dokument obsahující obě jména. V případě použití OR vyhledá dokumenty s oběma, nebo i jen jedním z nich. V případě použití operátoru NOT (např. Adam NOT Eva) vyhledá všechny dokumenty obsahující první hledané slovo (Adam) a zároveň neobsahující slovo druhé (Eva).

Dle tématu

Obrázek 4: Vyhledávání dle tématu, zdroj: https://www.tandfonline.com/

Tento výběr/způsob vyhledávání funguje tak, že uživatel si z dostupných 30 hlavních témat (či kategorií. Viz Obrázek 4) vybere jedno z nich. Vyhledávač zobrazí všechny dokumenty daného tématu a uživatel si následně může výsledky dále vyfiltrovat, stejně jako v případě Quick search. Ačkoli vyhledávač operuje se stovkami témat, na hlavní stránce se ukáže pouze dříve zmíněných 30, pro detailnější zobrazení musí uživatel otevřít postranní „subject“ menu (viz Obrázek 5 (číslo vedle názvu kategorie znázorňuje počet dokumentů v dané kategorii)). Kategorie mají hierarchickou strukturu.

Obrázek 5: Podkategorie, zdroj: https://www.tandfonline.com/topic/allsubjects/pi?target=topic&ConceptID=4274

Ostatní

Dalšími způsoby vyhledávání, kterým zde ale nebude dopřáno tolik prostoru, jako předchozím, jelikož nejsou tak důležité, je vyhledávání dle časopisu (autorský překlad, originálně „journal“) a trending vyhledávání.

Obě vyhledávání jsou poměrně jednoduché. V případě časopisů může uživatel výsledky hledat za pomoci filtru na počáteční písmeno nebo filtru na kategorii. V případě druhém, tj. trending/žebříček nejpopulárnějších uživatel nemůže výsledky filtrovat nijak, jelikož z podstaty myšlenky se mu zobrazí několik nejsledovanějších/nejstahovanějších dokumentů z databáze společnosti.

Struktura výsledků vyhledávání

Klasický výsledek

Obrázek 6: Příklad zobrazení výsledku vyhledávání, zdroj: https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636

Na obrázku nad tímto odstavcem (Obrázek 6) je zobrazen jeden z trending dokumentů v době psaní této práce. Jak je možné vidět, všechny relevantní informace, jako autor, název, datum vydání, umístění, odkaz na stažení PDF (některé dokumenty poskytují i formát pro e-čtečky EPUB), licence a mnoho ostatních jsou umístěny na jedné stránce. Co již na obrázku není vidět, je celý text článku, umístěný pod abstraktem. Přínosné je, že na pravé straně stránky jsou zobrazeny podobné dokumenty, které mohou některým lidem pomoci k lepšímu pochopení oblasti nebo poskytnout alternativu k dokumentu, na který právě nahlíží. Pro lidi se zrakovým postižením je také vestavěn speciální předčítač dokumentu.

Zajímavá je také záložka „Metrics“. Zde je možné zjistit, kolikrát byl dokument na této stránce zobrazen a kolikrát byl citován (s rozborem kde a kolikrát, sledují se např. „konkurenční“ knihovny Web of Science nebo Scopus). Zároveň se zde nachází „Altmetric“, tj. výsledky stejnojmenné společnosti o tomto dokumentu. Je zde možné sledovat, kolikrát a kde byl tento článek zmíněn (sledována média, blogy, sociální sítě (primárně Twitter a Reddit), wikipedie atd.). Stejně tak poskytuje mapu s rozložením těchto zmínek a pořadí na žebříčku mezi podobnými dokumenty (viz Obrázek 7, levá strana žebříček a počty zmínění dokumentu, pravá strana mapa rozložení „Tweetů“ o dokumentu).

Obrázek 7: Altmetric, zdroj: https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636#metrics-content

Časopis

V případě vyhledávání časopisů, výsledek vypadá následovně (viz Obrázek 8).

Obrázek 8: Výsledek hledání časopisu, zdroj: https://www.tandfonline.com/toc/rama20/current

Rozložení výsledku na stránce je velmi podobné minulému zobrazení dokumentu. Je možné zde nalézt název, obsah, vydavatele, jednotlivá vydání, články v jednotlivých vydáních (na které se je možné prokliknout), metriky časopisu a jeho článků, cíle časopisu a další.

Zároveň je možné vyhledávat články v rámci vybraného časopisu, filtrovat a řadit je. Dále je možné přihlásit se k odebírání novinek, stahovat články ve formátu PDF, nebo si nechat zobrazit nejcitovanější či nejzobrazovanější článek z časopisu.

Dodatečné služby

Možnosti odebírání novinek

Taylor & Francis umožňují uživatelům se přihlásit k odběru novinek/updatů o jednotlivých časopisech, či celé platformě. V případě odběru novinek o časopisech je možné využít RSS formát nebo email zprávy. V případě platformy pouze emaily. Společnost nepodporuje žádné jiné služby nebo API, které by umožnily externě získávat nebo manipulovat s daty.

RSS

Jedná se o klasický přenos dat přes RSS formát. Ukázka přenosu RSS dat (ohledně dříve zmíněného časopisu) je umístěna pod tímto odstavcem. K odběru novinek přes RSS se uživatel nemusí nijak registrovat, postačí mu pouze lokace, ze které bude schopný data získávat (možné ji získat kliknutím na příslušné tlačítko (viz Obrázek 8, modré tlačítko RSS nahoře uprostřed))

<item rdf:about="https://www.tandfonline.com/doi/full/10.1080/19416520.2016.1161977?af=R">
<title>Paradox and Contradiction in Organizations: Introducing Two Articles on Paradox and Contradiction in Organizations</title>
<link>https://www.tandfonline.com/doi/full/10.1080/19416520.2016.1161977?af=R</link>
<content:encoded><a href="/toc/rama20/10/1">Volume 10, Issue 1</a>, June 2016, Page 1-3<br/>. <br/></content:encoded>
<description>Volume 10, Issue 1, June 2016, Page 1-3<br/>. <br/></description>
<dc:title>Paradox and Contradiction in Organizations: Introducing Two Articles on Paradox and Contradiction in Organizations</dc:title>
<dc:identifier>10.1080/19416520.2016.1161977</dc:identifier>
<dc:source>The Academy of Management Annals</dc:source>
<dc:date>2016-04-13T02:35:35Z</dc:date>
<dc:rights>© 2016 Academy of Management</dc:rights>
<dc:creator>Forrest Briscoe</dc:creator>
<prism:publicationName>Paradox and Contradiction in Organizations: Introducing Two Articles on Paradox and Contradiction in Organizations</prism:publicationName>
<prism:volume>10</prism:volume>
<prism:number>1</prism:number>
<prism:startingPage>1</prism:startingPage>
<prism:endingPage>3</prism:endingPage>
<prism:coverDate>2016-01-01T08:00:00Z</prism:coverDate>
<prism:coverDisplayDate>2016-01-01T08:00:00Z</prism:coverDisplayDate>
<prism:doi>10.1080/19416520.2016.1161977</prism:doi>
<prism:url>https://www.tandfonline.com/doi/full/10.1080/19416520.2016.1161977?af=R</prism:url>
<prism:copyright>© 2016 Academy of Management</prism:copyright>
</item>

(ukázka pouze části dat)

Email

Pomocí emailových zpráv se může nechat uživatel nechat upozorňovat na změny, nové položky atd. co se na stránkách dějí. Je možné se registrovat pro odběr celkových novinek, kde jsou obsažena i marketingová sdělení, nebo pouze pro odběr novinek jednoho časopisu. Oba tyto odběry vyžadují registraci uživatele.

Covid

Společnost Taylor & Francis se snaží bojovat proti dezinformacím a informovat o reálném dění pomocí specializované Covid-19 kategorie, na kterou je možné se dostat přímo z hlavní stránky webu.

Všechny takto poskytované články mají „free access“ licenci a jsou tedy dostupné komukoliv, kdo by si chtěl o dané problematice něco přečíst.

Přímo dle stránek společnosti slouží tato iniciativa i k podpoře a propagování vědců a doktorů, kteří se touto problematikou zabývají (Informa PLC, 2021 d). Zároveň pak také poskytují odkazy na jiné důležité weby, časopisy, články nebo opatření, která se zabývají podobnou tématikou. Databáze Taylor & Francis takto dnes obsahuje přes 4 900 různých článků a dokumentů.

Licence

Pro uživatele existují reálně 3 typy licencí, se kterými se na stránkách Taylor & Francis může setkat. A to je popořadě: Free Access, Open Access a Closed Access.

S dokumenty Free Access může uživatel nakládat, jak chce. Má okamžitý přístup k obsahu i všem ostatním datům dokumentu. Může si jej stáhnout, citovat, přečíst na stránce atd. Bohužel společnost Taylor & Francis nespecifikují, jaké vlastnosti jimi definovaný Free Access nabízí, ale můžeme se domnívat, že zde nejspíše nejsou žádné limitace.

Druhou licencí je Open Access. Dokumenty s touto licencí mohou být také kýmkoliv čteny, citovány atd. Mají velmi podobné vlastnosti jako Free Access dokumenty, ale jsou vázány podmínkami Creative Commons (možné najít zde (Creative Commons, 2021)), nebo jinými podmínkami (vždy specifikováno u dokumentu).

No Access je poslední typ licence, u kterého si musí uživatel vyžádat či zakoupit přístup. Jedná se o nejstriktnější podmínku ze zmíněných tří (Informa PLC, 2021 e).

Obrázek 9: Access types, zdroj: https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636

(na Obrázek 9 jsou znázorněny 3 dokumenty, vrchní je licence Open Access (oranžový zámek), druhý Closed Access (prázdno) a třetí Free Access (zelený checkmark)).

Závěr

Veřejná knihovna Taylor & Francis Online je užitečná pomůcka pro vědecké, výzkumné, školní či informační účely. Obsahuje tisíce různých dokumentů z mnoha kategorií, které může uživatel volně použít, stavět na nich nebo jen číst.

Zároveň poskytuje zdarma informace o viru Covid-19 a snaží se bojovat proti dezinformacím distribucí článků a promotováním výzkumníků, doktorů a angažovaných osob z této oblasti. V práci byly rozebrány poskytované funkce knihovny, spolu s možnostmi vyhledávání. Byly představeny boolean operátory a filtry pokročilého hledání i unikátní způsoby hledání, jako například hledání dle časopisu. Dále byly představeny metriky, které společnost poskytuje a možnosti odebírání novinek.

Zdroje

CREATIVE COMMONS, 2021. Creative Commons — Attribution 4.0 International — CC BY 4.0 [online] [vid. 2021-11-08]. Dostupné z: https://creativecommons.org/licenses/by/4.0/

INFORMA PLC, 2021a. About Taylor & Francis. Taylor & Francis [online] [vid. 2021-11-07]. Dostupné z: https://taylorandfrancis.com/about/

INFORMA PLC, 2021b. About Us [online] [vid. 2021-11-07]. Dostupné z: https://www.informa.com/about-us/

INFORMA PLC, 2021c. COVID-19: Novel Coronavirus Content Free to Access. Taylor & Francis [online] [vid. 2021-11-08]. Dostupné z: https://taylorandfrancis.com/coronavirus/

INFORMA PLC, 2021d. Purpose & Principles [online] [vid. 2021-11-07]. Dostupné z: https://www.informa.com/about-us/purpose-principles/

INFORMA PLC, 2021e. Taylor & Francis Open Access | Taylor & Francis Online [online] [vid. 2021-11-08]. Dostupné z: https://www.tandfonline.com/openaccess

Seznam Obrázků

Obrázek 1: Logo Skupiny Taylor & Francis– https://taylorandfrancis.com/about/our-brands/

Obrázek 2: Příklad quick search– https://www.tandfonline.com/action/doSearch?AllField=covid

Obrázek 3: Advanced Search– https://www.tandfonline.com/search/advanced

Obrázek 4: Vyhledávání dle tématu– https://www.tandfonline.com/

Obrázek 5: Podkategorie– https://www.tandfonline.com/topic/allsubjects/pi?target=topic&ConceptID=4274

Obrázek 6: Příklad zobrazení výsledku vyhledávání– https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636

Obrázek 7: Altmetric– https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636#metrics-content

Obrázek 8: Výsledek hledání časopisu– https://www.tandfonline.com/toc/rama20/current

Obrázek 9: Access types– https://www.tandfonline.com/doi/full/10.1080/09644016.2021.1947636

Similarweb: znáte informační chování návštěvníků stránek?

0
silhouette of man illustration

Úvod

A i když v dnešní době není tak důležité sledovat jakou má kdo návštěvnost a důležitá je hlavně kvalitativní analýza dat na konkurenčních sítích a stránkách. Některé platformy na internetu umožňují webové stránky srovnávat z různých hledisek a nabízet tak nejen kvantitativní informace o počtu návštěvníků a míře prokliku, ale také jaká nejčastější slova návštěvníci těchto stránek hledají, v jaké kategorii nebo z jakých stránek se dostávají.

Informační zdroj Similarweb

Similarweb je společnost zabývající se poskytováním služeb jako jsou analýzy webových stránek nebo mobilních aplikací, aby pomáhala podnikům různých velikostí s informacemi o jejich zákaznících nebo konkurenci. Základem je datová analýza. Tato platforma v neplacené verzi poskytuje přehled o digitálním provozu webových stránek nebo aplikací a aktualizuje se jednou měsíčně.

Obr. 1 Úvodní stránka similarweb [zdroj: vlastní zpracování]

Jejich mise je poskytovat nejdůvěryhodnější, nejobsáhlejší a nejdetailnější pohled na digitální svět tak aby pomohli jejich zákazníkům překonat konkurenci a stát se jedničkou na trhu. Protože věří, že díky znalostem a jiným pohledům na data mohou pak firmy dělat lepší rozhodnutí a uspět tak v digitálním světě (Similarweb © 2021a).

Tato společnost vznikla v roce 2007 v Izraeli, nyní má kanceláře po celém světě (Lunden 2020).

Analyzují provoz na více než 100 milionech webových stránek a 4,7 milionech mobilních aplikací (Similarweb © 2021b).

Pro analýzu provozu jsou hlavně důležitá data, která společnost sbírá se statisticky reprezentativních datových sad, které jsou rozmanité napříč zeměmi, zařízeními, uživateli a hlavně odvětvími. Sběr dat probíhá pomocí následujících čtyř hlavních zdrojů.

Přímé měření primárními analytickými aplikacemi

Jsou to data, která jsou poskytovaná uživateli vlastnícími webové stránky a aplikace, ti si zvolí, že budou sdílet data z primárních analytických aplikací jako je například Google Analytics. Takto jsou poskytována jejich vlastní data i data jejich partnerů. Uživatelé díky tomu, že udělí souhlas s poskytováním těchto dat získají přehled porovnání digitálního provozu s dalšími webovými stránkami a aplikacemi, mohou tak svůj byznys vidět v mnohem širším kontextu a zejména týkajícím se trhu na kterém figurují. Zejména společnosti, které zpeněžují provoz na svých webových stránkách si často volí zveřejnění údajů o provozu ne jich webu, protože tím budou více atraktivní pro své zákazníky (Similarweb © 2021c).

Anonymní data ze zařízení

Po tomto zdroji dat následují anonymní údaje o digitálním provozu shromažďované z produktů Similarweb, které jsou nainstalované na zařízeních uživatelů těchto produktů a získávají tak anonymní data o chování těchto zařízení. U takto shromažďovaných dat je dán důraz na získávání údajů napříč různorodým publikem.

Veřejně dostupná

Dalším zdrojem jsou data, která jsou veřejně dostupná, Similarweb je algoritmicky zachycuje a indexuje. Pro upřesnění odhadů se do prediktivních modelů používají i údaje ze sčítání lidu.

Spolupráce

Posledním zdrojem jsou předem analyzovaná data získaná z různých spoluprací se společnostmi zabývajícími se CI a sběrem digitálních informací po celém internetu. Většina těchto společností sdílí analyzovaná data například pro zprávy, firmy nebo technologie. Partneři poskytující internetové připojení nebo poptávkové platformy jsou také součástí tohoto zdroje dat.

Po sběru dat probíhá datová syntéza pomocí procesů k vyčištění, porovnávání, syntézy, splynutí a zpracování za účelem modelování dat. Shromážděná data jsou normalizovaná ze všech datových zdrojů do jednoho pohledu, čímž může similarweb porovnávat weby a aplikace mezi sebou. Čištění dat a formátování vstupů dat je první krok. Data se odprošťují od různých osobních informací tak aby byly anonymizované. Dalším krokem je konsolidace dat, kde probíhá spojení velikého množství datových vstupů, aby mohlo být využité pokročilé prediktivní modelování. Posledním krokem syntézy dat je klasifikace datových vstupů kvůli kategorizaci a další syntézu.

Z hlediska datového modelování se na normalizovaná data používá pokročilá kalibrace strojového učení a prediktivní modely. Tyto techniky jsou využívány za účelem poskytování pravdivých a konzistentních pohledů na digitální data v čase. Učící modely strojového učení jsou používány pro snížení zkreslení a hluku dat.

Data jsou pak dodávány pomocí intelligence modulů jako přehledy připravené k použití buď na platformě similarweb nebo pomocí API (Similarweb © 2021c).

Vyhledávání webů a aplikací

Jak již bylo zmíněno v úvodu similarweb umožňuje zobrazovat informace o provozu a chování lidí na různých webových stránkách. Tato funkcionalita je volně dostupná a není třeba si vytvářet účet k získání přístupu k těmto údajům. Avšak to má jistá omezení jako že je to pouze základní přehled informací bez možnosti hlubšího poznání a nabízí jen limitovaný pohled do historie. Pro hlubší analýzy, přístup k více datům nebo možnosti využití API společnost similarweb nabízí různé placené produkty, kterými jsou produkt Research Intelligence, zaměřený na porovnávání společností a výkonu v rámci průmyslu a nabízí hlavně analýzy průmyslu, společností, aplikací, segmentů a zákazníků. Dalším produktem, který byl vybudován k optimalizaci získávání většího provozu na stránkách uživatelů se nazývá Digital Marketing Intelligence a je zaměřený hlavně na nástroje pro klíčová slova, reklamy a média. Dalšími produkty jsou Sales Intelligence, Investor Intelligence a Shopper intelligence. Těmito placenými produkty similarweb se v této práci nezabývám a následuje bližší přiblížení základní funkcionality.

Na úvodní stránce similarwebu je možné vyhledávat webové aplikace nebo stránky jen podle názvu nebo jeho části.

Obr. 2 Základní vyhledávání [zdroj: vlastní zpracování]

Dále jde vyhledávat pomocí žebříčků webů nebo aplikací. Z hlediska webových stránek se jedná o seznam 100 nejlepších stránek i když ve volně dostupné verzi se ukazuje jen 50 z nich. Jak můžeme vidět na obrázku níže (Obr. 3) webové stránky lze vyhledávat podle kategorie do které jsou zařazené a podle země. Výsledek hledání ukazuje změnu v řebříčku, jaká je průměrná doba strávená na stránkách, kolik průměrně stránek návštěvník prokliká a jaké je procento návštěvníků, kteří stránku ihned opustí.

Obr. 3 Nejlepší webové stránky [zdroj: vlastní zpracování]

V tomto přehledu získáme možnost vidět kdo je vydavatelem aplikace, jaké má hodnocení z hlediska použití, které je vypočítáno na základě instalací za poslední měsíc a aktivních uživatelů a jeho změnu a stejně tak hodnocení, které dostává od obchodu, v kterém je k dispozici ke stažení a také změnu. Řadit aplikace můžeme buď podle hodnocení použití nebo hodnocení obchodu.

Obr. 4 Řebříček nejlepších aplikací [zdroj: vlastní zpracování]

Oproti webovým stránkám u aplikací můžeme sledovat i trendy. Platí zde stejné možnosti vyhledávání jako u žebříčku. Ale v tomto pohledu můžeme vidět, které aplikace jsou právě v kurzu, které se nově dostali do nejlepších 100 aplikací, kterým hodnocení klesá a vypadli ze 100 nejlepších.

Obr. 5 Trendy aplikací [zdroj: vlastní zpracování]

Ukázky výsledku hledání

Při vyhledání webové stránky na platformě similarweb se uživateli zobrazí následující přehled. Pro účely této práce jsem zvolila webovou stránku univerzity www.vse.cz. Jak můžeme vidět z obrázku níže (Obr. 6) jsou k dispozici data ze září 2021. V horní části stránky se můžeme dozvědět globální pořadí v porovnání s ostatními webovými stránkami po celém světě, další údaj udává pořadí v České republice. Třetí údaj je trochu diskutabilní, jelikož se jedná o pořadí z hlediska kategorie v rámci země, podle údaje na obrázku se zdá, že web Vysoké školy ekonomické v Praze je 4. nejnavštěvovanějším z hlediska vysokoškolských webových stránek, ale po bližším zkoumání jsem zjistila, že je jen zařazen do jiné kategorie než, v které jsou webové stránky ČVUT nebo Karlovy univerzity. Takže je třeba tento údaj brát s rezervou a polohy z hlediska řebříčku nejlepších zkoumat v jiném pohledu zobrazení.

Obr. 6 Výsledky vyhledávání – přehled provozu [zdroj:vlastní zpracování]

Pěkný rozdíl ve výsledcích růstu nebo poklesu digitální provozu lze pozorovat v plošném grafu, kde je znatelný růst návštěvnosti v období zkouškového a jeho postupný pokles v letních měsících a růst s novým semestrem. Napravo jsou viditelné stejné údaje, které jsme si již mohli zobrazit v řebříčku nejlepších stránek.

Dalšími analýzami, které jsou k dispozici z hlediska provozu, a hlavně jeho zdrojů je mapa ukazující z jaké země se návštěvníci webové stránky připojují. Z hlediska VŠE není překvapením, že se více než 90 % návštěvníků je z České republiky. Hned pod grafem s mapou jsou vidět různé typy zdrojů pro zobrazení webových stránek v jejich desktopové verzi.

Obr. 7 Výsledky vyhledávání – zdroje provozu [zdroj: vlastní zpracování]

Dalším dostupným údajem je přehled stránek, které odkazují na www.vse.cz nebo naopak stránky, které návštěvníci navštíví odkazem z webové stránky.

Obr. 8 Výsledky vyhledávání – přesměrování [zdroj: vlastní zpracování]

Z hlediska nejčastěji vyhledávaných výrazů, které vedou k najité této webové stránky pomáhá následující přehled dělící se na výrazy neplacené, volně vyhledávané návštěvníky stránek a placená klíčová slova.

Obr. 9 Výsledky vyhledávání – vyhledávané termíny [zdroj: vlastní zpracování]

Předposledním přehledem je ukazatel sociálních médií, z kterých se lidé dostanou na stránky VŠE.

Obr. 10 Výsledky vyhledávání – sociální sítě [zdroj: vlastní zpracování]

Dalším možným pohledem je ukazatel z kde umístěných reklam proudí nejvíce návštěvníků, jelikož ale VŠE reklamy nepoužívá na obrázku níže je zobrazen přehled pro internetový obchod www.alza.cz.

Posledním možná nejzajímavějším přehledem je pohled na zájmy návštěvníků. Jsou zde zobrazené kategorie, o které se také zajímají, stránky, které často navštěvují a témata, která se jich týkají.

Obr. 11 Výsledky vyhledávání – zájmy publika [zdroj: vlastní zpracování]

Dále platforma similarweb také poskytuje přehled stránek, které jsou podobné nebo mají podobnou pozici v řebříčku. A mobilní aplikace, které se stránkou souvisí.

Podobné informace v menším měřítku lze zobrazovat pomocí nainstalovaného rozšíření do prohlížeče, jak je ukázáno na obrázku níže.

Obr. 12 Ukázka similarweb rozšíření v prohlížeči [zdroj: vlastní zpracování]

Similarweb také nabízí porovnání více webových stránek spolu navzájem. Ve volně dostupné verzi lze porovnávat jen dvě stránky najednou. Zkoušela jsem porovnat VŠE s ČZU a obě vysoké školy s celkem podobnými statistikami.

Obr. 13 Ukázka porovnání webových stránek [zdroj: vlastní zpracování]

Závěr

Ačkoliv se z hlediska platformy similarweb jedná o velmi propracovaný projekt, společnost ve volně dostupném neplaceném základu nabízí opravdu jen omezené množství údajů a dat, které bez koupení lepší licence jdou využít pro sledování konkurence minimálně. Myslím si, že na trhu platforem měřící digitální provoz na jiných stránkách existují další zajímavé alternativy, které umožňují mnohem hlubší pohledy na data jako jetřeba SpyFu nebo SE Ranking.

Zdroje

LUNDEN, Ingrid, 2020. SimilarWeb raises $120M for its AI-based market intelligence platform for sites and apps. TechCrunch [online]. [vid. 2021-12-06]. Dostupné z: https://social.techcrunch.com/2020/10/27/similarweb-raises-120m-for-its-ai-based-market-intelligence-platform-for-sites-and-apps/

SIMILARWEB, © 2021a. About Us | Our Mission, Company, and History. Similarweb [online] [vid. 2021-10-17]. Dostupné z: https://www.similarweb.com/corp/about/

SIMILARWEB, © 2021b. Our Data. Similarweb [online] [vid. 2021-10-17]. Dostupné z: https://www.similarweb.com/corp/ourdata/

SIMILARWEB, © 2021c. Similarweb Data Methodology. Similarweb Knowledge Center [online] [vid. 2021-10-17]. Dostupné z: https://support.similarweb.com/hc/en-us/articles/360001631538-Similarweb-Data-Methodology

Seznam Obrázků

Obr. 1 Úvodní stránka similarweb [zdroj: vlastní zpracování]

Obr. 2 Základní vyhledávání [zdroj: vlastní zpracování]

Obr. 3 Nejlepší webové stránky [zdroj: vlastní zpracování]

Obr. 4 Řebříček nejlepších aplikací [zdroj: vlastní zpracování]

Obr. 5 Trendy aplikací [zdroj: vlastní zpracování]

Obr. 6 Výsledky vyhledávání – přehled provozu [zdroj:vlastní zpracování]

Obr. 7 Výsledky vyhledávání – zdroje provozu [zdroj: vlastní zpracování]

Obr. 8 Výsledky vyhledávání – přesměrování [zdroj: vlastní zpracování]

Obr. 9 Výsledky vyhledávání – vyhledávané termíny [zdroj: vlastní zpracování]

Obr. 10 Výsledky vyhledávání – sociální sítě [zdroj: vlastní zpracování]

Obr. 11 Výsledky vyhledávání – zájmy publika [zdroj: vlastní zpracování]

Obr. 12 Ukázka similarweb rozšíření v prohlížeči [zdroj: vlastní zpracování]

Obr. 13 Ukázka porovnání webových stránek [zdroj: vlastní zpracování]

sigma explorer. Stopařův průvodce po katastrofách

0

sigma explorer (sigma-explorer.com) je velice užitečným datovým nástrojem vytvořeným a spravovaným světově největší zajišťovnou Swiss Re. Hlavními výhodami je volná přístupnost, jednoduchost ovládání. možnosti exportu výstupů v nejčastěji užívaných formátech a přehlednost obsažených informací.

Již půl století vydává Swiss Re institute pro odbornou veřejnost články, publikace, data sety, pořádá konference, skrze něž prezentuje výsledky analýz a výzkumu v oblastech statistiky, modelování rizika pro podporu rozhodování risk managementu nejen vlastních klientů. Všechny články i publikace jsou dohledatelné na webových stránkách Swiss Re institutu swissre.com/institute/
Procházet všechny jednotlivé publikace a články je samozřejmě zdlouhavé a nepohodlné. Proto Swiss Re vytvořilo nástroj sigma explorer, který výstupní data zobrazuje v jednom integrovaném grafickém rozhraní s mnoha interaktivními možnostmi.[1]

Obrázek 1 Homepage sigma-explorer.com

Po pravé straně homepage se nachází výběr hlavních tematických skupin časových řad, které sigma explorer nabízí. Tyto skupiny jsou: 1. Catastrophes, 2. World Insurance premiuns, 3. Macroeconomic resilience index, 4. Insurance resilience index and protection gap

Vzhledem k široké variaci možných výstupů budu prezentovat od některých skupiny možné grafické datové výstupy odpovídající na jednoduchou otázku, na níž v rámci každé kategorie budu hledat odpověď.

Otázka: Je pravdivé tvrzení, že změna klimatu dochází k častějším přírodním katastrofám?

Odpověď nalezneme v kategorii řad Catastrophes. Nejvhodnější zobrazení bude Line Chart, Data Set – Number of events a Peril type – Natural Catstrophes:

Obrázek 2 Katastrofy-možnosti zobrazení časových řad

Výstup bude vypadat takto:

Obrázek 3 Katastrofy – graf

Vzestupný trend počtu přírodních je na časové řadě od roku 1970 zřetelně vidět. Nástroj nabízí možnost exportu grafu ve formátech .png, .jpg, .pdf

Otázka: Jaká zemětřesení byla za posledních 30 let v Asii nejsmrtelnější?

Pro porovnání jednotlivých katastrof je sigma explorer nejlepším nástrojem, který je bezplatně a neomezeně přístupný. Nabízí možnosti vizualizace na mapu světa, výběr příčiny katastrofy, lze zvolit region a srovnávací měřítko, jak je vidět na obrázku níže:

Obrázek 4 Katastrofy – možnosti volby parametrů pro srovnání

Samotný výstup je na obrázku níže, kde velikost zabarveného kruhů odpovídá počtu obětí. Pokud bychom ve výběru možností zvolili jiný Data set, velikost kruhů by odpovídala Data setu a v případě volby zobrazení více Perils najednou budou kruhy odlišeny i barevně.

Obrázek 5 mapa katastrofických zemětřesení v Asii

Jak je vidět na obrázku, tak v počtu obětí byla nejničivější zemětřesení v Indonésii a střední Číně. Pokud klikneme na kruh vybrané katastrofy, zobrazí se výstup poskytující stručný popis události a základní statistiky. Pro srovnání uvádím hned dva pod sebou:

Obrázek 6 Katastrofy – zemětřesení Inodnésie
Obrázek 7 Katastrofy – zemětřesení Čína

Otázka: Jaký je rozdíl v penetraci životního pojištění na vyspělých a rozvojových trzích

Penetrací pojištění můžeme rozumět jako relativním výdajům na pojistnou ochranu k HDP dané země. Je třeba upozornit, že nelze bez dalšího vyvozovat závěry o úrovni ochrany pojištěných v dané zemi, protože každá země má jinak nastavený daňový systém, kde mnohde jsou rezervotvorná životní různými formami podporována, sociální systém a jinou demografii. Výstup pak můžeme zvolit na světové mapě takto:

Obrázek 8 World insurance premiums – volba parametrů

Samotný výstup je níže, kdy můžeme měnit posuvníkem v horní části rok, za který chceme data zobrazit:

Obrázek 9 Penetrace životního pojištění – mapa světa

Každá země je barevně rozlišena podle intervalu výše procentních výdajů na HDP své ekonomiky. Můžeme také vidět, že některé méně vyspělé trhy nejsou zastoupeny vůbec, protože Swiss Re nemá dostatečná nebo žádná data.

Po rozkliknutí vybrané země se nám zobrazí výstup shrnující základní relevantní statistiky pojistného trhu, kde můžeme zvolit mezi zobrazením pro jeden rok nebo časovou řadou. Po najetí kurzoru myši na bod na křivce zobrazené v grafu se zobrazí konkrétní výše hodnoty pro daný rok.

Obrázek 10 Základní statistiky českého pojistného trhu

Dalšími kategoriemi jsou Macroeconomic resilience index a Insurance resilience index and protection gap, které jsou srozumitelné jen pro odbornou veřejnost se znalostí metodologie a kontextu. Rozhodl jsem se proto je zde neuvádět.

Zdroj:

Sigma-explorer [online]. Zurich: Swiss RE [cit. 2021-12-06]. Dostupné z: https://www.sigma-explorer.com/


[1] Kompletní metodologie dat je dostupná na https://www.sigma-explorer.com/documentation/Methodology_sigma-explorer.com.pdf

Manuscriptorium: prohledávejte digitalizované kulturní dědictví

0
people in red and gold costume

Manuscriptorium (http://www.manuscriptorium.com/cs) se dá nejlépe charakterizovat jako bibliografická, potažmo plnotextová databáze, ve které je možno se pohybovat a vyhledávat s volným přístupem.

Manuscriptorium je duální (česká a anglická) digitální knihovna a badatelské prostředí. [2] Jedná se o digitální knihovnu, která poskytuje digitální verze dokumentů, která jsou součástí kulturního dědictví. V této databázi je obsaženo přes pět milionů obrazů, stovky tisíc popisných záznamů a více než sto dvacet tisíc digitálních kopií dokumentů. Databáze je koncipována jako digitální knihovna rukopisů, starých tisků, map a mnoho dalších vzácných dokumentů. [1]

Smyslem Manuscriptoria ovšem není pouhé shromažďování digitálních dokumentů, ale také jejich zařazení do kontextu dané doby. [3]

Manuscriptorium si klade za cíl poskytnout přístup ke „všem existujícím historickým zdrojům“ a zpřístupnit veškerý možný obsah prostřednictvím „jednotného rozhraní“. Za tímto hlavním účelem uložiště v současné době shromažďuje obsah od více než 100 partnerů z více než 20 zemí světa. [2]

Uživatelé

Nejběžnějšími uživateli databáze jsou především badatelé kulturních a historických institucí, studenti, učitelé a také samozřejmě nadšenci do různých tisků určité doby, jelikož obsahuje zejména rukopisy, prvotisky, staré tisky (do roku 1800), mapy, listiny a další dokumenty kulturního dědictví. [1]

Historie a vývoj

Databáze byla spuštěna poprvé v roce 2003 jako součást programu Memoriae Mundi Series Bohemica (MMSB) a navázala na projekt organizace UNESCO s názvem „Memory of the World“, ve kterém působila Národní knihovna České republiky již o roku 1992. Ta je také koordinátorem celého projektu a na tvorbě celé databáze se podílí primárně s českou společností AIP Beroun, která je u nás jedním z největších expertů na postupy digitalizace. [3]

Na vývoji některých nástrojů se v rámci evropských projektů podíleli zahraniční instituce, jako je třeba Oxfordská „University Computing Services“, která pracovala především na ENRICH schématu, jakožto vnitřním a výměnném formátu Manuscriptoria. Dále „Supercomputing and Networking Center“ z Poznaně, kteří pomohli s Gaiji Bank a v neposlední řadě také „Centro per la comunicazione e l’integrazione dei media“ z Florencie v případě spolupráce na druhé verzi uživatelského prostředí. [4]

Databáze

Cílem Manuscriptoria je poskytnutí jednotného rozhraní pro vyhledávání ve více digitálních knihovnách nejen v ČR, kde jsou agregovány data asi z 55 institucí, ale díky účasti na projektu Europeana je jí umožněna spolupráce s řadou dalších institucí ze zahraničí. Její číslo je momentálně přes šedesát. Mezi největší zahraniční přispěvatele se podle počtu sdílených dokumentů řadí Španělsko Rusko, Polsko, Itálie, Litva, Island, Rumunsko, nebo například Švýcarsko.  [3]

Data vznikají také za spolupráce se společností Google v rámci projektu digitalizace tisků převážně sedmnáctého a osmnáctého století.

Zajímavostí může být fakt, že databáze momentálně shromažďuje přes 85 % digitalizovaných historických dokumentů ze všech evropských národních knihoven. [5]

Typy dokumentů

Dokumenty mohou být zobrazeny kromě full textové podoby také jako faksimilie, což jsou velice přesné napodobeniny originálu, většinou starých tisků nebo rukopisů. Kopie bývá často od původního dokumentu velmi těžko rozpoznatelná. Dalším typem je konvolut, který není nic jiného, než několik tisků svázaných pohromadě a knihovnicky jednotně zpracovávaných.

Nástroje

Manuscriptorium nabízí hned několik nástrojů. Některé z nich jsou ovšem vázané na to, že budete mít v systému založen svůj osobní profil.

Moje knihovna

Jako první z funkcí bych zmínil možnost sestavit si svůj vlastní virtuální dokument. Přihlášení uživatelé mohou ukládat vyhledaný obsah do oblíbených položek.

Děje se tak v sekci „Moje knihovna“, kde si z oblíbených položek (ať už celých dokumentů, či jen samostatných stránek) můžeme vytvořit kolekci záznamů, které se sdruží do pojmenovaných tematických kolekcí. Z těch si pak můžete složit svůj vlastní virtuální dokument, kde budete mít obrazy z více předloh.

Moje knihovna, zdroj: http://www.manuscriptorium.com/cs

Jazyk

Celé Manuscriptorium je možno procházet buď v českém, nebo anglickém jazyce, což je velice přínosné i pro uživatelé, kteří cizí jazyk plně neovládají.

Česká verze, zdroj: http://www.manuscriptorium.com/cs
Anglická verze, zdroj: http://www.manuscriptorium.com/en

Vyhledávání

Uživatelské prostředí pro vyhledávání poskytuje vše, co je potřeba. Je možno vyhledávat například podle určitého výrazu, který je možno hledat ať už kdekoliv, nebo v konkrétním titulu, autorovi, signatuře, textu a mnoho dalších možnostech, které by vás mohli napadnout.

Uživatelé mohou zúžit počáteční dotazy na konkrétní pole pomocí funkce „zpřesnit“. Touto funkcí lze vyhledávat v aktuálním vyhledávání či obsah odebrat z aktuálních výsledků.

Dalším vyhledávacím nástrojem je poté pokročilé vyhledávání, které bude nejspíše to nejdůležitější. Zde si můžete nekombinovat výrazy v různých částech dokumentů. Operátory, které lze využít při vyhledávání jsou a, nebo, bez těmito operátory lze vyloučit či zúžit hledaný obsah podle požadavků. Po nalezení výsledků je pak možno je ještě dále filtrovat podle plných textů, faksimilí[1], či konvolutů[2].


[1] přesná napodobenina originálu, od kopie těžko rozlišitelná

[2] několik spisů svázaných pohromadě

Pokročilé vyhledávání, zdroj: http://www.manuscriptorium.com/cs

Texty

Jelikož většina dokumentů pochází ze středověku, tak jsou texty často doplněny poznámkami, opraveny chyby a doplněna interpunkce, aby byly dokumenty i dnešnímu čtenáři srozumitelné.

Doplňkové nástroje

VISK 6

Slouží k poskytnutí generátoru ID čísla podle místa uložení dokumentu. Také funguje jako validátor chyb.

M-Tool 2.0

Zprostředkovává generaci digitálního XML dokumentu z originálu. [3]

Gaiji bank

Umožňuje vkládání a vyhledávání nestandardních znamének a písmen užívaných v dané době. [3]

Pro partnery

TEI P5 ENRICH schéma

Jedná se o formát XML pro strukturu dat, kterými partneři projektu ENRICH přispívají do databáze Manuscriptoria, ať už přímo nebo prostřednictvím transformačního procesu. [6] Schéma definované tímto dokumentem se vztahuje na tři rozdílné aspekty digitalizovaného rukopisu:

  • metadata popisující originální rukopisný zdroj
  • metadata popisující digitalizované obrazy originálního rukopisného zdroje
  • transkribce textu obsaženého v originálním rukopisném zdroji [6]

OAI-PMH vytěžování

Jednoduchý nízkoprahový mechanismus pro snadnou interoperabilitu mezi repozitáři s protokolem používaným pro sklízení metadat. [7]

Uživatel

Po velice jednoduché registraci je umožněno uživateli veškeré vyhledávání v publikovaném obsahu, ukládání a vytváření virtuálních dokumentů. Pouze pro autentizované uživatele, tedy především ty ze spolupracujících organizací, je umožněno přes editor vkládat nová díla.

Informace o díle

V této části se podíváme na to, jaké konkrétní informace nám Manuscriptorium poskytne o daném díle. Zde jsme náhodně vybrali dílo s názvem „Atlantis Austriaci“ (Moll, 1748-1775), která se nabízí v plnotextové podobě.

Ze všeho nejdřív se objevíme na záložce „souhrn“, která nám poskytne ty nejrelevantnější informace, jako je název, autor, rok vytvoření, kde se kniha nachází, v jakém je jazyce, také daná licence k dílu atd.

Náhled karty "Souhrn", zdroj: http://www.manuscriptorium.com/cs
Náhled karty "Souhrn", zdroj: http://www.manuscriptorium.com/cs
Náhled karty "Souhrn", zdroj: http://www.manuscriptorium.com/cs

Druhou záložkou je „Detail“, kde nalezneme veškeré další a podrobnější informace, jako je například i samotný obsah díla, popis papíru, či látky vazby, historie, vznik a mnoho dalšího.

Detail obsahuje informace o uložení, záhlaví, obsah, fyzický popis a historii a veškeré dostupné informace o původu. U mnoha digitalizovaných zdrojů se jedná o velmi užitečný obsah, který poskytuje podrobné bibliografické informace a odkazy na faksimilní obrázky.

Náhled karty "Detail", zdroj: http://www.manuscriptorium.com/cs
Náhled karty "Detail", zdroj: http://www.manuscriptorium.com/cs
Náhled karty "Detail", zdroj: http://www.manuscriptorium.com/cs

Třetí záložkou jsou faksimile, kde už najdeme jednotlivé stránky daného díla. Zde si uživatelé mohou kliknout na miniaturu pro zobrazení obrázku/díla v plné velikosti.

Náhled karty "Faksimilie", zdroj: http://www.manuscriptorium.com/cs

Poslední už je XML, kde nenajdeme nic jiného než celý kód k dílu.

Náhled karty "XML“, zdroj: http://www.manuscriptorium.com/cs

Příklady využití

Manuscriptorium je digitální knihovna, která zabezpečuje, získává, zpracovává a zpřístupňuje digitální informace v tomto případě důležité historické rukopisy a staré spisy, mapy a jiné vzácné dokumenty, které jsou důležité pro zachování kulturního dědictví.

Projekt se zaměřuje dále i na zařízení do kontextu jejich vzniku a doby ze které pochází.

Využít informační zdroj manuscriptorium je hlavně pro badatele, kde mohou zdroje získávat a dále sdílet s ostatními. Dále je zdroj vhodný i pro mnoho vysokoškolských studentů, kteří se oborově zaměřují na historii, archivnictví, knihovnictví a další.

Závěr

Manuscriptorium toho nabízí spoustu pro každého návštěvníka. Ať už jím je student, učitel, badatel, nebo jen nadšenec, každý si jistě najde přesně to, pro co si zde přišel. Funkcí pro vyhledávání, či další práci s díly je dostatek a celková přehlednost databáze je určitě nadprůměrná. Celkově si myslím, že pro vyhledávání určitých dokumentů se zde určitě budu vracet.

Veškeré uvedené obrázky byli vytvořené výstřižky z http://www.manuscriptorium.com.

Zdroje

[1] Manuscriptorium | Europeana Pro. Empowering digital change for the cultural heritage sector | Europeana Pro [online]. Dostupné z: https://pro.europeana.eu/organisation/manuscriptorium

[2] WHARTON, R., 2016. Manuscriptorium. Digital Philology, Spring, vol. 5, no. 1, pp. 4-I,II,III,IV ProQuest Central. ISSN 21629544.

[3] Manuscriptorium v Evropě (Tomáš Psohlavec) | Ikaros. Ikaros | elektronický časopis o informační společnosti [online]. Copyright © 1997 [cit. 21.12.2020]. Dostupné z: https://ikaros.cz/manuscriptorium-v-evrope-tomas-psohlavec

[4] Manuscriptorium: Open Catalogue of Historical Collections and Digital Library of manuscripts and rare old printed books | Europeana Pro. Empowering digital change for the cultural heritage sector | Europeana Pro [online]. Dostupné z: https://pro.europeana.eu/data/manuscriptorium-open-catalogue-of-historical-collections-and-digital-library-of-manuscripts-and-rare-old-printed-books

[5] Czech National Library digitizes its collections with Google | Prague Post. Prague Post | World’s Breaking News [online]. Dostupné z: https://www.praguepost.com/czech-news/41342-czech-national-library-digitizes-its-collections-with-google

[6] TEI P5 ENRICH schéma | Manuscriptorium. Manuscriptorium | [online]. Dostupné z: http://www.manuscriptorium.com/cs/tei-p5-enrich-schema-cs

[7] HANOUSEK, Tomáš. OAI-PMH pro začátečníky. Praha, 2007. Příloha č. 4 k výzkumné zprávě projektu VE20072009004. Dostupné z: https://www.nacr.cz/wp-content/uploads/2019/05/moznosti_06.pdf

International Monetary Fund (imf.org) – přehled o finanční a ekonomické kondici světa na jednom místě

0

Úvod

Dnešní svět se neustále mění a s ním i ekonomická a finanční situace jednotlivých států. Veřejné i soukromé organizace potřebují ke svému správnému rozhodování řadu ekonomických dat o stavu ekonomiky v jednotlivých zemích, vývoji důležitých finančních ukazatelů a predikci jejich budoucího vývoje. Tyto a další kvalitní podložené informace mohou získat na stránce Mezinárodního měnového fondu (International Monetary Fund) imf.org.

Mezinárodní měnový fond

Mezinárodní měnový fond (International Monetary Fund, IMF) je organizace založena v roce 1944 původně 44 členskými státy na Brettonwoodské konferenci v New Hampshire, USA a její hlavní kancelář se momentálně nachází ve Washingtonu, D.C. Organizace vznikla v reakci na následky velké hospodářské krize, jejíž následky svět tvrdě pocítil ve 30.letech 20.století. Momentálně je členy 190 zemí světa a mezi zaměstnanci jsou lidé 150 národností.

Primárním cílem  IMF bylo a je zajistit stabilitu mezinárodního měnového systému – systému mezinárodních směnných kurzů a mezinárodních plateb. Druhou významnou činností organizace je monitorování politik členských zemí a vývoj jejich ekonomické a finanční situace. Organizace také poskytuje poradenství s cílem snížit riziko různých ekonomických a finančních krizí a zvýšit životní úroveň v členských zemích a prosazuje politiky určené k podpoře ekonomické stability.Mezinárodní měnový fond zároveň poskytuje státům školení a technickou podporu pro rozvoj jednotlivých částí finančního systému (regulace bankovních systémů, řízení státních výdajů, ekonomická statistika apod.). V čele IMF stojí Rada guvernérů skládající se z jednoho guvernéra a jeho zástupce za každou členskou zemi.Vedle webové stránky jako hlavního informačního zdroje, se kterým budeme pracovat zde, je nutné také zmínit aktivitu IMF na sociálních sítích a dalších informačních platformách, kde můžeme získat aktuální a zajímavé informace přímo od organizace.

IMF dále se svými uživateli komunikuje prostřednictví sociálních sítí:

  • Twitter
  • Instagram
  • Facebook
  • LinkedIn
  • Youtube
  • Flickr

Členění webu-základní orientace v datovém zdroji

Web IMF může být užitečným informačním kanálem jak pro profesionály, tak i pro studenty. Kromě angličtiny jako hlavního informačního jazyka je k dispozici ještě 6 dalších jazykových mutacích, a to arabština, čínština, francouzština, japonština, ruština a španělština. Stránka nabízí celou řadu typů informací o své činnosti a ekonomické situaci svých členů. V úvodním panelu máme k dispozici následující záložky:

  • O nás (About)
  • Výzkum (Research)
    • Zde nalezneme publikace a reporty zpracované na různá ekonomická témata
  • Státy (Countries)
    • Reporty a publikace tříděné dle jednotlivých států nebo regionálních kanceláří IMF
  • Rozvoj kapacit (Capacity development)
  • Zprávy (News)
    • Mediální sekce s veřejnou částí i s heslem chráněnou částí pro novináře
  • Videa (Videos)
  • Data (Data)
  • Publikace (Publications)
    • Třídění dle typu zdroje
  • Covid-19
    • Speciální sekce založena pro snadnější sledování dění v jednotlivých státech v souvislosti s onemocněním
Obrázek 1 Titulní strana webu IMF s hlavním panelem; zdroj: imf.org

Vyhledávání na imf.org

Pokud víme, jaké informace hledáme na webu a nechceme postupně procházet jednotlivé sekce, využijeme vyhledávací pole v pravé horní části úvodního panelu (viz obrázek 1) a spustíme vyhledávání. Vyhledávací pole webu imf.org umožňuje filtrovat dotaz dle dalších kritérií až v následujícím kroku po spuštění vyhledávání. Na obrázku 2 vidíme výsledek dotazu do vyhledávacího pole po zadání výrazu HDP (GDP).

Obrázek 2 Výsledek hledání po zadání dotazu HDP (GDP) do vyhledávacího pole; zdroj: imf.org

Specifikace dotazu

Po spuštění vyhledávání nás web přesměruje na stránku, kde můžeme s prvotním výsledkem dále pracovat. V prostřední části okna máme k dispozici články, statistické soubory a další výsledky, které klíčové slovo/a obsahují. Výsledky můžeme řadit podle:

  • Relevance (Relevancy)
  • Od nejstarších (Oldest)
  • Od nejnovějších (Newest)
Obrázek 3 Řazení výsledků vyhledávání na dotaz GDP; zdroj:imf.org

Filtrace dotazu

Výsledky vyhledávání můžeme dále třídit podle:

  • Typu obsahu (Content Type)
    • Zde specifikujeme, zda hledáme publikaci, novinky, události, dokumenty regionálních kanceláří organizace, národní dokumenty, data, multimédia, kurzy a factsheets (list informací)
  • Téma (Topic)
    • Zde vybíráme mezi vnějším sektorem, průřezovými problémy, finančním a peněžním sektorem, reálným sektorem, fiskálním sektorem a ekonomickou teorií a metodami

Obě skupiny se při rozkliknutí hlavních kategorií rozpadají na podkategorie a dotaz tak lze dále poměrně detailně specifikovat.

  • Předmět publikace (Publication Subject)
  • Autora (Author)
  • Data vložení (Date)
    • Poslední 3 měsíce, 6 měsíců, rok, 3 roky a 5 let
  • Země, které se výsledek týká (Country)
Obrázek 4 Specifikace dotazu GDP pomocí filtrů; zdroj: imf.org

V pravé části obrazovky (obrázek 2) pak máme k dispozici odkaz na analýzu, pokud je k dispozici, a odkaz na publikaci, která se tematicky týká vyhledávaného dotazu GDP. Zároveň u vybraných dotazů nabízí IMF vysvětlení, co vlastně daný pojem znamená, a to pomocí výukových materiálů, na které odkazuje. Tím je téma zpřístupněno i uživatelům, kteří nedisponují znalostmi ekonomie a financí.

Obrázek 5 Výukové video vysvětlující video GDP (HDP); zdroj: imf.org

Zaměřeno na data

Web IMF nabízí skutečně nepřeberné množství informací, jednou z nejvíce využívaných a také nejvíce užitečných sekcí je samostatná část webu zaměřená na data. Tato sekce nabízí několik možností:

  • IMF Finance (IMF Financies)
  • Další zdroje dat (Additional Data Sources)
  • Databáze světových ekonomických výhledů (World Economic Outlook Databases)
  • Databáze (Database)
  • IMF datová eknihovna (IMF eLibrary-Data)
  • Mezinárodní finanční statistika (International Financial Statistics)
  • G20 Data Gaps Initiative
  • Měnové složení oficiálních devizových rezerv (Currency Composition of Official Foreign Exchange Reserves)
  • Průzkum finančního přístupu (Financial Access Survey)

Lze si zobrazit a stahovat předpřipravené datové sety nebo si sami vytvářet datové sestavy. Jako první se podíváme na interaktivní panely. Největší množství dat získáme přímo kolonky „Data“ na úvodním panelu webu.

Data

IMF zveřejňuje celou řadu dat na samostatném panelu. V úvodu této části webu máme k dispozici populární odkazy na nejoblíbenější reporty. Pokud nevíme, v jaké sekci webu můžeme náš dotaz hledat, můžeme využít průvodce IMF daty (A Guide to IMF Data).

Obrázek 6 Úvodní panel sekce Data; zdroj: imf.org

Záložka data je rozdělena:

  • Globální data (Global Data)
  • IMF finanční data (IMF Financial Data)
  • Údaje o směnném kurzu (Exchange Rates)

Po přesunutí na sekci „Global Data“ se můžeme přesunout na data podle tématu přes kliknutí na název panelu a tlačítko více (more). Pak již pracujeme s příslušným tematickým panelem. Po výběru vybraného tematického panelu se zobrazí možnost pracovat se skupinou ukazatelů.

Obrázek 7 Tematický datový panel IMF; zdroj: imf.org

Obvykle máme k dispozici velmi podobnou strukturu informací v horním panelu:

  • Informace o skupině ukazatelů, se kterými se v dané sekci setkáme (IFS Home)
  • Tabulky dat (Data Tables)
  • Dotaz (Query)
    • Panel umožňující vytvářet vlastní dotaz přes kombinaci ukazatelů a výběr typu vizualizace nebo zápisu dat
  • Archiv starších datových setů (Archive)
  • Grafy (Graphs)
    • U některých panelů je rovnou k dispozici soustava typických dotazů v grafické podobě, např. u skupiny ukazatelů v části s názvem Platební bilance
  • Dokumenty (Documents)
    • U některých panelů je uživateli k dispozici sekce klíčových dokumentů, ze kterých jsou data nebo metodika jejich zpracování čerpány

Práce s daty IMF v rámci tematického panelu

Datové tabulky (Data Tables)

Po otevření této záložky získáme data rozdělená do skupin, u příkladu sekce „International Financial Statistics“ podle zemí anebo podle indikátorů. Po otevření např. záložky GDP (HDP) získáme následující výstup.

Obrázek 8 Dataset ve formě excelové tabulky; zdroj: imf.org

Datový set nám v této podobě dává hned několik možností:

  • Určit si podobu dat z hlediska času (roční či čtvrtletní data)
  • Omezit délku časové řady, které se tabulka týká
  • Rozložit souhrnný ukazatel na jednotlivé složky
    • V případě GDP tak můžeme v tabulce zobrazit např. pouze spotřební výdaje domácností za jednotlivé státy a ostatní vynechat

Tabulka má také vlastní vyhledávací pole, kde můžeme dále specifikovat, co hledáme.

Obrázek 9 Vyhledávání v datovém setu v podobě excelové tabulky; zdroj: imf.org

Vyhledávání v tabulce lze omezit na konkrétní stát, hledat můžeme hodnotu nebo text a vyhledávat můžeme skrz řádky nebo sloupce. Můžeme také stanovit požadavek, aby hledaný výraz odpovídal celé buňce nebo se shodoval s hledaným výrazem. Vyhledávací pole ale bohužel neobsahuje možnost využít operátory jako AND nebo OR.

Celkový výsledek pak lze exportovat z webové adresy v podobě souborů s koncovkami .xlsx, .xls, .pdf, .rtf, .pptx, .html, .emf anebo můžeme soubor rovnou vytisknout.

Query (Dotaz)

K sestavení odpovědi můžeme využít také interaktivní pole pro zadávání dotazů. Po rozkliknutí záložky „Query“ v horním panelu (viz obrázek 7) je zobrazen interaktivní panel (viz obrázek 10). V bočním panelu Datový pohled (Data view) můžeme jako uživatelé přesouvat jednotlivé položky podle toho, jaký typ výstupu potřebujeme. Na výběr máme z 3 možností:

  • Čas (Time)
  • Země (Countries)
  • Indikátory (Indicators)

Všechny tyto proměnné a dimenze můžeme z dotazu libovolně vyřadit či naopak.

Čas (Time)

S časem můžeme pracovat několika způsoby. K dispozici máme:

  • list s jednotlivými roky s rozpadem na čtvrtletí a měsíce, u vybraných ukazatelů pak také na pololetí, týdny a dny, kdy můžeme vybírat jen určitá období-tedy např. 2019Q1 a 2020Q3. Usnadnit vyhledávání si můžeme také přes vyhledávací pole, kde zadáme příslušný rok.
  • vzorec
    • zde můžeme opět pracovat s frekvencí zobrazení dat
    • zároveň můžeme nastavovat interval přes sloupce od (from) a do (to) kdy v řádku pod nimi vidíme nastavený rozsah (viz obrázek 11)
  • časové řady (Timeline)

Obrázek 10 Úvodní obrazovka panelu Query; zdroj: imf.org

Obrázek 11 Panel „Vzorec“; zdroj: imf.org

Země (Countries)

Můžeme si vybrat 1 a více zemí, za které chceme znát výsledky indikátorů.

Indikátory (Indicators)

Můžeme si vybrat jeden či více indikátorů, jejichž hodnoty chceme zobrazit. Pokud země hodnoty daného indikátoru nevykazuje, výsledek za stát se nám nezobrazí.

Záložka pohled (View)

Zásadní položkou v záložce pohled (view) je podoba, v jaké se nám data zobrazí.  Na výběr máme z následujících možností:

  • tabulka (table)
  • sloupcový graf (column)
  • skládaný sloupcový graf (stacked column)
  • pruhový graf (bar)
  • pruhový skládaný graf (stacked bar)
  • spojnicový graf (line)
  • křivka (spline)
  • mapa (map)
  • koláčový graf (pie)
  • stromová mapa (treemap)
  • hodnocení (rating)
  • pole (area)
  • radar (radar)
  • bublina (bubble)
  • rozptyl (scatter)

Ne na každý typ ukazatele se ale hodí všechny pohledy. Dále ponecháme pozadí (background) v přednastavené podobě nebo jej změníme na jinou barvu. Můžeme skrýt či nechat zobrazen název legendy (legend) a vybrat barevnou škálu (Colors).

Pokročilý uživatel může pracovat se záložkou Pokročilé (Advanced). Jedná se nicméně o funkci, kterou pro běžnou práci s daty nepotřebujeme a nastavuje se manuálně. Hotový výsledek si můžeme exportovat (kolonka export) ve formátech souborů .xlsx, .pdf, .pptx a .png. Zároveň můžeme poskytnout jinému uživateli přímý odkaz (Direct link-pod kolonkou „share“), aby si náš výsledek prohlédl na webové stránce. Pokud bychom si chtěli výsledek uložit přímo na webu, musíme mít vytvořený uživatelský profil.

Podíváme se na příklad odpovědi na dotaz, jak vypadají hodnoty za ukazatel Platební bilance, běžný účet, zboží a služby, kredit, BPM6, v amerických dolarech (Balance of Payments, Current Account, Good and Services, Credit, BPM 6, US Dollar) za rok 2017 a 3 státy. Výsledek požadujeme v podobě pruhového grafu.

Obrázek 12 Ukazatel zobrazen v podobě lineárního sloupcového grafu za 1 rok a 3 státy; zdroj:imf.org

Zajímavý je formát mapy, který si zobrazíme na druhém příkladu, jak lze nalézt velké množství přehledně setříděných dat.

Datová e-knihovna IMF a zobrazení dat v mapě světa

Mimo záložku „Data“, se kterou už jsme pracovali, můžeme využít také elektronickou knihovnu dat. Do ní se dostaneme přes hlavní panel na úvodní stránce, kdy kurzorem najedeme na záložku „Data“ a rozklikneme položku „IMF eLibrary-Data“. Na úvodním panelu pak v prostředním sloupci vybereme „Platební bilance a mezinárodní investiční pozice (Balance of Paymens and International Investment Position)“.

Obrázek 13 Úvodní panel datové e-knihovny IMF; zdroj: imf.org

Opět se dostaneme do interaktivního panelu „Query“. V horní liště si zvolíme pohled na data v podobě mapy (map). Opět si navolíme země, kterých se má ukazatel týkat a příslušný ukazatel, tentokrát se nám změní lišta „Data view“ a tentokrát vidíme odlišné kolonky:

  • Státy (Countries)
  • Barva (Color)
  • Listovat podle (Page by)

Vedle samostatné kolonky „Countries“ musíme přesunout položku „Indicator“ do kolonky „Color“, abychom viděli jednotlivé státy světa probarvené na mapě dle hodnot, kterých ukazatel za danou zemi dosáhl.  Do části „Page by“ přetáhneme položku „Time“ s navoleným obdobím, kterého se mapa bude týkat. Výsledek vidíme na obrázku 14.

Obrázek 14 Mapa rozlišující úroveň ukazatele Current account – Goods and Servises (Běžný účet-zboží a služby); zdroj: imf.org

Na mapě v dolní části obrázku vidíme časovou osu. Po kliknutí na příslušné období se mapa přebarví podle dosažených hodnot ukazatelů za dané období. Po najetí kurzorem na příslušnou část barevné osy vidí uživatel, jakých hodnot stát dané barvy dosáhl. Zároveň po kliknutí na daný stát a Ukázat nápovědu (Show hint) zobrazíme a připneme na mapě název státu a časové období.

Předpřipravená data

Web IMF rovněž poskytuje řadu již hotových sestav dat, které si pouze zobrazíme a rychle tak najdeme to, co potřebujeme. Podívejme se na příklady, kde sestavy najdeme a jak je lze využít – Data Mapper, World Economic Outlook a předpřipravené grafy.

IMF Data Mapper

Prvním příkladem je „Data Mapper“, tedy záložka, kterou najdeme v horní části webu IMF Data. V horním panelu můžeme připravená data vybírat ze dvou položek: datových setů (datasets) a databáze světových ekonomických výhledů (World Economic Outlook Databases). Jako první je zobrazen náhled na část Data Mapper.

Obrázek 15 Mapa zobrazující hodnoty růstu reálného HDP (GDP) za rok 1996; zdroj: imf.org

Mapa funguje zároveň jako animace. Kliknutím na šipku v levém dolním rohu pod mapou spustíme animaci, kdy se nám zobrazují jednotlivé roky a zároveň se mění barva států podle změny hodnot ukazatele. Vysvětlivky pro hodnoty se nachází v horní části mapy. Přímo na mapu je pak navázaný lineární graf a spodní část panelu obsahuje seznam ukazatelů, které můžeme dále sledovat.

World Economic Outlook Databases (Databáze světových ekonomických výhledů)

Do této části se dostaneme přes záložku „Data“ z úvodního panelu a otevřením příslušné části záložky.  Po jejím otevření se dostaneme k rozdělení dat podle zemí, skupin států a možnosti stahovat datové sety. Pokud pracujeme s předpřipravenými soustavami výsledků na webu, vybereme jednu z prvních 2 možností.

Obrázek 16 Úvodní panel World Economic Outlook Databases; zdroj: imf.org

Postupně pouze vybereme všechny státy nebo případně odznačíme ty, které nechceme zahrnout, vybereme ukazatel a nastavení časového rozsahu a můžeme přes přípravu reportu

(prepare report) vytvořit report na webu a následně si jej i stáhnout. Vše je intuitivní a snadné.

Panel Pokročilé na konci před vytvořením reportu nemusí běžný uživatel řešit.

Grafy a tabulky

Na webu můžeme využít řadu již hotových grafů a tabulek, které lze následně stahovat.

Již vytvořené grafy si můžeme prohlédnout v e-knihovně a po výběru datasetu klikneme na kolonku Grafy (Charts), a pak už jen vybereme graf, který chceme zobrazit.

Obrázek 17 Připravený graf ze záložky Grafy (Charts); zdroj: imf.org

Závěr

Webové stránky Mezinárodního měnového fondu imf.org nabízí velké množství dat, se kterými lze pracovat. Z pohledu dat lze zobrazovat data zpracovaná do různé grafické nebo textové podoby, případně vytvářet úplně nové datové sestavy. Můžeme také stahovat a číst oficiální organizací vydané publikace a dokumenty nebo samostatné zdroje dat a dále s nimi pracovat v jiných programech mimo web. Ke stejným typům dat se dostaneme hned několika cestami. Pokud nemáme znalosti z oblasti ekonomie a financí a nerozumíme některým pojmům, web nabízí velké množství vzdělávacích materiálů, ze kterých můžeme čerpat.

Zdroje

[1]International Monetary Fund. imf.org[online]. Dostupné z:https://www.imf.org/en/Home

Shodan.io – najnebezpečnejší internetový vyhľadávač

0

Shodan je vyhľadávač zariadení pripojených na internet. Na rozdiel od tradičných vyhľadávačov ako napríklad Google alebo Bing neindexuje webové stránky, ale IP adresy- respektíve zariadenia pripojené do siete internet z dostupných IP adries. Shodan zbiera údaje o všetkých zariadeniach, ktoré sú pripojené do internetu. Ak je zariadenie priamo pripojené do siete (teda nie je chránené systémom ako napríklad Firewall), Shodan si od zariadenia „vyžiada“ dostupné informácie, ktoré mu zariadenie poskytne.

V čom sa Shodan líši od Googlu?

Základným rozdielom je princíp, ako vyhľadávače indexujú výsledky. Shodan prechádza celý internet, Google prechádza len povrchovú časť internetu na ktorej sú dostupné webové stránky- World Wide Web. Avšak ten obsahuje len malú časť zariadení, ktoré sú skutočne pripojené k internetu. Shodan má za cieľ poskytnúť celkový obraz internetu.

Ďalším rozdielom je, že na to aby ste mohli používať Shodan potrebujete znalosť vyhľadávacích dotazov s ktorými operuje. Napríklad nestačí do vyhľadávača vložiť dotaz „jadrové elektrárne v Česku“ a očakávať výsledky. Shodan bol navrhnutý pre vývojárov a špecialistov ktorí potrebujú k svojej práci maximum dostupných informácii a na to aby ste ich vedeli interpretovať potrebujete znalosti vyhľadávacích dotazov.

Možnosti zariadení, ktoré dokáže Shodan vyhľadať sú neobmedzené- od malých domácich počítačov až po automyčky alebo jadrové elektrárne. V nasledujúcich kapitolách je predstavená štruktúra vyhľadávania (vyhľadávacie dotazy), proces indexácie zariadení a príklady využitia. [1]

Proces indexácie

Na to, aby sme pochopili ako funguje vyhľadávanie v nástroji Shodan si musíme najprv objasniť, ako Shodan zbiera dáta o dostupných zariadeniach.

Banner

Zariadenia (napríklad servery, počítače, akýkoľvek hardware) sú pripojené do siete a poskytujú výkon pre služby, ktoré na nich fungujú. Shodan zbiera informácie práve o týchto službách. Každá služba prezentuje niečo ako svoju vizitku alebo banner. Tá obsahuje rôzne parametre, ktoré sa líšia u každej služby. Shodan prechádza celý internet a zbiera údaje, ktoré sú obsiahnuté v tejto vizitke. Ukážka nižšie obsahuje vizitku alebo banner webovej služby:

HTTP/1.1 200 OK
Server: nginx/1.1.19
Date: Sat, 03 Oct 2015 06:09:24 GMT
Content-Type: text/html; charset=utf-8
Content-Length: 6466
Connection: keep-alive

Z informácii ktoré nám webová služba poskytla môžeme zistiť, že na zariadení funguje nginx software vo verzii 1.1.19. Nižšie je ukážka banneru priemyselného riadiaceho systému Siemens S7:

Copyright: Original Siemens Equipment
PLC name: S7_Turbine
Module type: CPU 313C
Unknown (129): Boot Loader           A
Module: 6ES7 313-5BG04-0AB0  v.0.3
Basic Firmware: v.3.3.8
Module name: CPU 313C
Serial number of module: S Q-D9U083642013
Plant identification: 
Basic Hardware: 6ES7 313-5BG04-0AB0  v.0.3

Z ukážky je jasné, že systém poskytol úplne iný banner obsahujúci oveľa viac informácii ako napríklad firmware, sériové číslo a rôzne ďalšie detaily o službe. Z dôvodu rôznych bannerov a parametrov ktoré môžu obsahovať je nutné vedieť, akú službu chceme v Shodane vyhľadávať ešte predtým ako s vyhľadávaním začneme. [2]

Štruktúra zdroja

Keď už vieme, ako Shodan indexuje dostupné služby, môžeme sa detailnejšie pozrieť na štruktúru dotazov a výsledkov, ktoré dokážeme vyhľadať.

Vyhľadávacie dotazy

Vyhľadávacie dotazy majú špecifický formát ktorý musí byť zachovaný, inak vyhľadávač nezobrazí správne výsledky. Dotazy majú nasledujúci formát: filter:hodnota V položke filter zadávame atribút vizitky, ktorý chceme vyhľadať. Hodnota reprezentuje konkrétnu položku, ktorú chceme vyhľadať.

Príklad jednoduchého vyhľadávacieho dotazu je napríklad vyhľadávanie podľa krajiny: country:CZ. Filter krajiny vyžaduje názov krajiny vo formáte dvoch veľkých písmen. V našom prípade CZ- Česko. Po zadaní tohto dotazu Shodan vypíše všetky výsledky nachádzajúce sa na území Česka.

Ukážku špecifického vyhľadávacieho dotazu je možné ilustrovať na príklade webovej služby v predošlej kapitole. Ak by sme chceli hľadať webové služby nginx vo verzii 1.1.19, do vyhľadávača Shodan by sme napísali dotaz Server: "nginx/1.1.19". Ak hodnota, ktorú sa snažíte vyhľadať obsahuje medzery alebo chcete vyhľadať konkrétnu kombináciu, musíte použiť úvodzovky ako v ukážke.

Vyhľadávacie dotazy je možné ľubovoľne kombinovať aby ste zúžili počet výsledkov, ako napríklad Server: "nginx/1.1.19" country:CZ

Ak neviete čo hľadáte, prípadne chcete Shodan len vyskúšať, môžete prezerať populárne vyhľadávacie dotazy na adrese https://www.shodan.io/explore

Značky

Značky (Tags) sú vytvorené užívateľmi Shodanu a pomáhajú v jednoduchšej orientácii vo vyhľadávači. Obrázok nižšie zobrazuje populárne značky, ktoré pomáhajú identifikovať vyhľadávacie dotazy.

Obrázok 1: Populárne tagy na webe Shodan.io [zdroj obrázku: https://www.shodan.io/explore]

Na ďalšom obrázku môžeme vidieť výsledok vyhľadávania dotazu "IN-TANK INVENTORY", ktorý by mal hľadať čerpacie stanice. Prvý výsledok na adrese 46.38.231.56 z Nemecka obsahuje tag honeypot, druhý výsledok z USA obsahuje tag ics.

Obrázok 2: Výsledky vyhľadávania dotazu v Shodane [zdroj obrázku: https://www.shodan.io/search?query=%22IN-TANK+INVENTORY%22]

Príklady využitia

Informácie získane zo Shodanu môžu byť aplikované v mnohých legitímnych odvetviach. Vyhľadávač za posledné roky získal mnoho pozornosti aj z dôvodov, že je často spájaný s hackermi, ktorý ho využívajú za účelom identifikácie obetí a zraniteľných systémov- od malých firiem až po nemocnice, elektrárne alebo rôznych vládnych systémov.

  • Zabezpečenie siete: vyhľadajte si svoju IP adresu a uistite sa, že vaše zariadenia nie sú verejne prístupné z internetu [1]
  • Prieskum trhu: marketingoví pracovníci môžu získať prehľad, aké modely zariadení používajú ľudia po celom svete [1]
  • Kyberbezpečnosť / penetračné testy: špecialisti na IT bezpečnosť používajú tento nástroj za účelom testovania bezpečnosti organizácii [1]
  • IoT: väčšina IoT zariadení je priamo pripojená do internetu, čo znamená že si môžete na Shodane vyhľadať modely chladničiek, svetiel, zámkov a rôznych prvkov chytrej domácnosti [1]
  • Sledovať ransomware: Shodan umožňuje vyhľadávať niektoré verzie vírusov typu ransomware, čím pomáha špecialistom na IT bezpečnosť identifikovať rozsah útoku [1]

Záver

Shodan je mocný vyhľadávací nástroj ktorý môže v nesprávnych rukách spôsobiť veľké škody. Jeho funkcie avšak nevyužívajú žiadne ilegálne praktiky, zhromažďuje len údaje ktoré sú verejne prístupné a upozorňuje na nedostatočné zabezpečenie kritickej infraštruktúry.

Zdroje

[1]       „What is Shodan? – Shodan Help Center“. https://help.shodan.io/the-basics/what-is-shodan (viděno pro. 07, 2021).

[2]       „Search Query Fundamentals – Shodan Help Center“. https://help.shodan.io/the-basics/search-query-fundamentals (viděno pro. 07, 2021).

Zoznam obrázkov

Obrázok 1: Populárne tagy na webe Shodan.io [zdroj obrázku: https://www.shodan.io/explore]
Obrázok 2: Výsledky vyhľadávania dotazu v Shodane [zdroj obrázku: https://www.shodan.io/search?query=%22IN-TANK+INVENTORY%22]

Tableau Public. Jeden ze základních nástrojů pro vizualizaci

0
black flat screen computer monitor

Úvod

V dnešní době jsou data velmi klíčová a jejich objem každým dnem neustále roste. Růst objemu dat není lineární, nýbrž exponenciální. Z tohoto důvodu vzniká stále více a více reportingových nástrojů, které dokážou rychle a přehledně vizualizovat data, aby jim každý porozuměl. Tuto oblast by šlo pojmenovat jako Self-Service Business Intelligence neboli SSBI. Jedná se o odnoš Business Intelligence, která je cíleně zaměřena pouze na uživatele, kteří nemají dlouhou zkušenost v rámci programovacích či skriptovacích jazyků, ale i přesto potřebují dennodenně zacházet s daty a vyvozovat z nich závěry. S těmito nástroji se tedy snižuje potřeba rozsáhlých IT oddělení, aby vytvářeli reporty pro manažery, ale manažeři jsou si schopni tyto reporty založit sami. Mezi nejznámější nástroje patří SAP Analytics Cloud, Power BI a nebo právě Tableau Public [2].

Tableau Public

Tableau Software je společnost, která byla založena v roce 2003 a v roce 2019 byla prodána společnosti Salesforce za astronomických 15,7 miliard dolarů [1]. Už tato částka podtrhuje úspěch Tableau a po akvizici společností Salesforce, která stojí za nejúspěšnějšími CRM nástroji se dá očekávat ještě větší upevnění na trhu. Společnost Tableau Software již začala rozšiřovat své produktové portfolio, které momentálně tvoří Tableau Desktop, Tableau Server, Tableau Online, Tableau Public, Tableau Prep Builder a Vizable.

Předmětem tohoto článku bude zejména volně dostupný software Tableau Public, který slouží jako základní nástroj pro vizualizaci dat a následnou publikaci. Nutno podotknout, že tato verze je značně omezena a není určena pro komerční použití, na rozdíl od Tableau Desktop, které obsahuje pokročilé funkcionality. Publikace vytvořených reportů v Tableau Public je možná pouze jako veřejná, což znamená, že vytvořený report bude zpřístupněn všem uživatelům Tableau Public.

Práce s daty

Pro nahráni dat slouží záložka Data Source. Data je možné náhrát v různých formátech, např. JSON, .txt, Access databáze, .xlsx, PDF a jiné. Kromě možnosti nahrání dat, umožňuje Tableau také nahlédnutí a úpravu dat. Mezi nejčastější změny patří funkce JOIN, PIVOT či UNPIVOT tabulek nebo změnění či filtrování sloupců.

Samotná JOIN funkce je implementována v rámci Tableau velmi intuitivně, jelikož se jedná o jednu z nejčastějších funkcí co se týče prací s daty. V Tableau je tato funkce implementována v takzvaných vztazích, což je pouze vylepšená verze funkce JOIN, jelikož vztahy se dokážou přizpůsobovat momentální vizualizaci jakou člověk zvolí. Tudíž to není jako u funkce JOIN zvoleno napevno, jestli se vezmou data pouze podle průniku či doplňku, nýbrž je tato vlastnost adaptabilní.

Obrázek 1: Ukázka vztahů

Data jdou dále upravit pomocí SQL příkazů, které jsou již určeny pro pokročilejší uživatele, nicméně umožňují dělat nad daty rozsáhlé selekce či grouping nebo právě funkci PIVOT či UNPIVOT, která jednotlivé sloupce převede na řádky nebo opačně. Příklad využití této funkce je možný vidět na Obrázku 2.

Obrázek 2: Ukázka PIVOT funkce v rámci SQL příkladu

Tvorba grafů

Pro vytváření grafů slouží zejména záložka Worksheet.

Pro práci s daty se data rozdělují do dvou skupin: metriky a dimenze. Dimenze značí nějaký popis dat či charakter (barva, datum, typ, atd.) a metriky jsou zejména číselné hodnoty (počet, zisk, počet obyvatel, ..). Dimenze Tableau označuje buď písmeny Abc nebo jinými symboly, které označují datový typ dimenze. Křížkem se poté označují metriky a v závislosti na typu proměnné se může jednat o spojitou (zelené barva) nebo diskrétní (modrá barva) proměnnou. Tableau automaticky po nahrání datasetu projede celý dataset a vhodně nastav proměnné jestli jsou metriky či dimenze. Uživatel má poté možnost toto rozdělení libovolně změnit, ovšem lze říci, že ve většině případů je algoritmus spolehlivý a typy určí správně.

 Obrázek 3: Zobrazení metrik a dimenzí

Tableau je velmi interaktivní nástroj a jako takové funguje zejména na principu drag&drop nebo klikání. Uživatel si vybírá jednotlivé metriky či dimenze a ty následně přesune buď do pole Columns či Rows. Tableau již poté vhodně zvolí příslušnou vizualizaci a více méně vše je již uděláno automaticky. Uživatel má poté možnost danou vizualizaci měnit na základě atributů tzv. Marks, které jsou barva, či velikost (např. sloupců). Tento atribut může být i změněn dynamicky, což znamená, že jiná metrika či dimenze je zvolena jako škála pro atribut. Příklad možností atributů vizualizace je uveden na Obrázku 4.

Obrázek 4: Zobrazení metrik a dimenzí

Význam těchto atributů lze popsat následovně:

  • atribut Color přizpůsobí barvy grafu (např. měsíc který je ziskový bude vyznačen zelenou barvu a měsíc kdy byla ztráta bude zbarven do červena)
  • atribut Size ovlivní velikost a nebo šířku zobrazení záznamů v grafu (např. lidnatější stát bude mít větší sloupec než stát s menší populací)
  • atribut Detail umožňuje vybrat level detailu grafu. Tento atribut je velmi užitečný pro vytvořeních tzv. Reference lines
  • atribut Tooltip umožnní zobrazení dodatečných informací při pohybu kurzoru nad grafem (v rámci Tooltipu je možné zobrazit i vizualizace)
  • atribut Label přidá ke grafu popisky

K vizualizacím je možné přidat i filtry nebo různé legendy či popisky. Je na to určen sloupec napravo, který má fixní výšku. Tento sloupec je zobrazován jak pro Worksheets tak i pro Dashboardy.

Obrázek 5: sloupec pro filtraci a legendu

Dashboardy

Dashboardy slouží zejména pro spojení jednotlivých vizualizací z worksheetů. Dashboardy jsou nejčastějším místem pro prezentování vizualizací, protože prezentovat pouze jeden graf pomocí worksheetů je neprektické. Dále po publikaci umožňují dashboardy funkci Lock, která zabrání jakémukoliv uživateli s právy pouze na prohlížení, aby mohl finální dashboard editovat a tedy nějak rozhodit. Dashboardy jdou také libovolně stylisticky upravit a případně je možné udělat i interaktivní a propojené dashboardy, kdy po kliknutí na hodnotu na dashboardu je uživatel automaticky přesměrován na jiný dashboard. Příklad hotového dashboardu lze vidět na Obrázku 6.

Ukládání a publikování

Všechny vizualizace vytvořené v Tableau Public je možné uložit na veřejný server. Odtud se poté výsledné vizualizace mohou sdílet na jakékoliv další stránky. Jak již ovšem název Public napovídá, všechny vizualizace jsou dostupné veřejně pro každého a tudíž si je může každý registrovaný uživatel zobrazit. V závislosti na nastavení lze vizualizaci chránit proti editingu či filtraci.

Závěr

Tableau je opravdu skvělý názor a jeho největší výhodou je jednoduchost ovládání. Nástroj je přímo určen pro lidi co nemají jakékoliv znalosti v oblasti programování a tudíž je naprosto ideální pro lidi, kteří se spíše více orientují v businessu. Základní free verze Tableau Public je spíše určena pro edukativní a privátní účely, jakýkoliv podnik by si poté měl zakoupit licenci pro Tableau Desktop, která stojí přibližně 1500 Kč za měsíc.

Zdroje

[1] Tableau Software, LLC, a Salesforce Company [online]. 2021 [cit. 2021-12-08]. Dostupné z: https://public.tableau.com/s/

[2] GeekWire, Nat Levy [online]. 2021 [cit. 2021-12-08]. Dostupné z: https://www.geekwire.com/2019/salesforce-completes-15-7b-acquisition-tableau-software-creating-new-enterprise-tech-force/

Národní uložiště šedé literatury (NUŠL)

0

1. Úvodní představení

Národní uložiště šedé literatury (NUŠL) je digitální repozitář cílem kterého je shromažďovat, uchovávat a zveřejňovat informace, které se řadí pod pojem šedé literatury. (1)

Co je šedá literatura? Šedou literaturou (někdy také nepublikovaná nebo polopublikovaná literatura) jsou označované informace, které neprošly klasickým vydavatelským procesem nebo jsou sdílené institucemi primární činnosti kterých není vydavatelství. Tyto informace jsou produkované vládními, akademickými, průmyslovými institucemi atd. (2)

NUŠL je služba Národní technické knihovny, která nabízí svým uživatelům bezplatný přistup k šedé literatuře. Informace jsou získané díky spolupráce z různými producenty šedé literatury. Momentálně vyhledávací rozhráni NUŠL nabízí přibližně 620 000 dokumentu, jejichž původci jsou různé výzkumné instituce, statní a soukromé vysoké školy, muzea, galerie, neziskové organizace atd.  Přínosem této spolupráce pro producenty je dlouhodobá archivace dokumentů, zviditelnění těchto institucí a jejích výstupů v rámci České republiky i zahraničí a také usnadnění povinného zveřejnění informaci pro tyto instituce. (1, 2)

Obr.1 Logo NUŠL. Zdroj: (9)

2. Rešeršní možnosti / Struktura zdroje / Typologie dokumentů

NUŠL se skládá z dvou částí: centrální vyhledávací rozhraní (http://www.nusl.cz/) a digitální repozitář (https://invenio.nusl.cz/). Cely NUŠL systém a jeho komponenty jsou přehledně zobrazené na Obr. 2. (4)

Obr. 2 NUŠL a jeho komponenty. Zdroj: vlastní zpracování,  (4)

2.1. Digitální repozitář

Digitální repozitář je volně přístupný, přičemž je provozován pomoci softwaru Invenio. Tento software je možné volně instalovat, používat, upravovat a uložené informace následně šířit mezi spolupracujícími organizacemi. V rámci nastaveni Invenio pro potřeby repozitáře NUŠL proběhly různé úpravy včetně nastaveni sbírek a šablon. Kromě toho byla provedena grafická úprava rozhraní, které je dostupné v českém a anglickém jazyce. (4)

Na hlavní stránce (viz Obr. 3) je vidět, že dokumenty jsou dělené podle sbírek a zaměření. Sbírky jsou rozdělené do následujících kategorií: Vysokoškolské kvalifikační práce, Zprávy, Autorské práce, Firemní literatura, Konferenční materiály, Analytické a metodické materiály, Propagační a vzdělávací materiály. Sbírky jsou následně rozdělené do subkategorií. Například sbírka Vysokoškolské kvalifikační práce je rozdělená do následujících kategorii: Bakalářské práce, Diplomové práce, Disertační práce, Habilitační práce, Rigorózní práce.

Obr. 3 Hlavní stránka digitálního repozitáře. Zdroj: (8)

Zaměření v digitálním repozitáři jsou vymezené do následujících kategorií: školství, kultura, věda a výzkum, statni zprava a ostatní. Každé z těchto zaměření, podobně jako i u sbírek, je rozděleno do subkategorií, například zaměření Kultura obsahuje následující subkategorií: Galerie, Institut umění – Divadelní ústav, Knihovny, Muzea, Národní filmový archiv, Národní památkový ústav, Národní ústav lidové kultury.

2.1.1. Jednoduché vyhledávání

Na hlavni stránce digitálního depozitáře je přednastavené jednoduché vyhledávání. Zaškrtávací pole v sekci „Hledat jen ve sbírce:“ (viz Obr. 3) umožňují omezit vyhledávání jen v požadovaných sbírkách. Po zadaní jednoduchého dotazu zobrazí se výsledky hledáni, které jsou zároveň roztříděné podle sbírek (viz Obr. 4). Výsledky hledáni je možné seřadit podle datumu zveřejněni, autora, čísla záznamu nebo podle podobnosti slov. Pro každou sbírku je také možné nastavit požadovány počet výsledků. Uživatel může také zobrazit výsledky v jednom seznamu, tj. výsledky nebudou tříděné podle sbírek. Kromě toho uživatel může vybrat výstupní formát výsledků a to citace, HTML brief, HTML brief + PSH, HTML + citesummary, MARC, Refman RIS. (5)

Obr. 4 Obrazovka výsledků hledání v digitálním repozitáři. Zdroj: (8)

Vyhledávání se také dá provádět hned v požadované sbírce nebo zaměření. Na hlavni stránce při výběru konkrétní sbírky nebo zaměření systém nabídne dostupné subkategorie. Po výběru požadované subkategorii zobrazí se dokumenty, které patří do vybrané subkategorii. Následně je možné do vyhledávacího pole zadat libovolný dotaz.

2.1.2. Pokročilé vyhledávání

Pokročilé vyhledávání nabízí pohodlné nástroje pro dotazovaní v digitálním depozitáři. Rozbalovací seznam (viz Obr. 5) umožňuje zadat řetězec slov, který bude vyhodnocený repozitářem jako přesná fráze nebo regulární výraz. Navíc pomoci moznosti „jedno ze slov“ nebo „část výrazu“ v rozbalovacím seznamu systém použije operátor OR pro zadaný řetězec slov. Při rozšířeném vyhledávání je také možné upřesnit v jakém přesně poli musí být vyhledán řetězec slov. Dostupná pole pro vyhledáváni jsou název, autoři, klíčová slova, datum zveřejněni, instituce, typ dokumentu, název konference, ISBN/ISSN, číslo projektu, plny text, číslo záznamu.  Kromě toho repozitář umožňuje použití operátorů AND, OR a NOT. Nakonec záznamy se da filtrovat podle datumu zveřejněni.

Výsledky hledáni se dá seřazovat stejně jako i v jednoduchém vyhledávání. Jednoduché vyhledávání se v zásadě neliší od pokročilého, pokud bude použita speciální syntaxe, která bude vysvětlena v oddílu 2.1.3 Syntax, operátory

Obr. 5 Obrazovka pokročilého vyhledávání v digitálním repozitáři. Zdroj: (8)

2.1.3. Syntax, operátory

Vyhledávání fráze

Pro vyhledávání konkrétní fráze je možné použít uvozovky. Existuji dva režimy vyhledáváni frázi:

  • Dvojité uvozovky („…“) – vyhledávají přesnou frázi. Při použití dvojitých uvozovek zobrazí se pouze výsledky, které se shodují se zadaným řetězcem.
  • Jednoduché uvozovky (‚…‘) – vyhledává dílčí fráze. Tento režim připomíná vyhledáváni fráze v Google vyhledávače. Na rozdíl od dvojitých uvozovek tento režim zohledňuje text, který se nachází za nebo před zadaným kritériem v jednoduchých uvozovkách. (5)
Booleovské operátory

Při vyhledáváni v repozitáři NUŠL je možné použit operátory AND, OR a NOT. Použiti operátoru v dotazech je názorně zobrazené v Tab. 1. (5)

ANDreferenční +modelnalezne všechny záznamy, které obsahuji oba slova
referenční modeltotéž
referenční AND modeltotéž
ORreferenční |modelnalezne všechny záznamy, které obsahuji alespoň jedno slovo
referenční OR modeltotéž
NOTreferenční -modelnalezne všechny záznamy, které obsahuji slovo „referenční“, ale neobsahuji „model“
referenční NOT modeltotéž
Tab.  1 Booleovské operátory. Zdroj: vlastní zpracování, (5)
Kulaté závorky

Vyhledávač také podporuje použití kulatých závorek, které pomáhají sloučit booleovské výrazy do skupin. Je možné použít libovolný počet závorek, uznávají se i vnořené závorky. (5)

Speciální znaky a interpunkce

Vyhledávač v repozitáři také podporuje vyhledaní dotazů se speciálními znaky, například, „C++“ nebo „sin2 2θ13 = 0.084±0.005“. Na druhou stranu vyhledávač nerozlišuje velká a mala písmena. (5)

Mezinárodní znaky

Vyhledavač také rozpoznává Unicode UTF-8 znaky, což umožňuje vytváření dotazů v různých jazycích. (5)

Hledání se zástupným znakem *

Vyhledávač podporuje použití zástupného znaku hvězdička (*). Například, při zadáni model*, hvězdička doplní libovolný počet znaků a nalezne záznamy, které kupříkladu obsahují slova modelovat, modelovaní atd. Hvězdičku se da doplnit i uprostřed slova. (5)

Strukturované metadatové vyhledávání

Vyhledávač také podporuje vyhledáváni v rámci různých bibliografických poli, například author:Puškin, title:model, abstract:model, keywords:model. (5)

2.2. Centrální rozhraní

Centrální rozhraní představuje indexační a vyhledávací systém nad digitálním repozitářem NUŠL a dalšími spolupracujícími repozitáři. Takový přístup je zajištěn open source systémem Elasticsearch. (4)

Vyhledávání v centrálním rozhraní NUŠL probíhá podle navigace umístěné nalevo (viz Obr. 6). Dokumenty je možné vyhledávat podle 5 hlavních kategorií: typ dokumentu, osoby, klíčová slova, jazyk a plný text.

Obr. 6 Centrální rozhraní NUŠL. Zdroj: (7)

Kategorie Typ dokumentu je strukturovaná do dvou úrovní. Například, složka Analytické a metodické materiály, která se nachází v první úrovně se dál děli na analýzy, metodiky a studie, což představuje druhou úroveň děleni.  Další složky nacházející se v první úrovní jsou: Autorské práce, Firemní literatura, Konferenční materiály, Ostatní, Propagační materiály, Vysokoškolské práce a Zprávy. (6)

Kategorie Osoby obsahuje názvy instituce, například Český statistický úřad, Univerzita Karlova nebo jména lidi, které mohou být jak autory dokumentů, tak i například vedoucí vysokoškolských práci. Defaultně jsou vždy zobrazené 4 položky a po stisknuti tlačítka „zobrazit vice“ zobrazí se celkově 20 položek. (6)

Kategorie Klíčova slova obsahuje fráze a terminy v českém a anglickém jazyce. Stejně jako i u kategorii Osoby ve výchozím nastavení zobrazují se 4 terminy a po rozkliknuti se zobrazí dalších 16 terminů.

V kategorii Jazyk se nachází až 8 jazyků na výběr: čeština, angličtina, slovenština, němčina, francouzština, ruština, španělština a polština.

Poslední kategorie Plný text nabízí výběr mezi dokumenty podle dostupnosti plného text. 

Kromě popsaných kategorii, v centrálním rozhraní je také dostupné vyhledávání ve sbírkách, které byly zmíněné výše v podkapitole

2.2.1 Digitální repozitář

Mimoto každá stránka obsahuje časovou osu (viz Obr. 7), které pomáhá omezit výsledky vyhledávaní podle roku. Časová osa také ukazuje počet dostupných dokumentů.

Centrální rozhraní také obsahuje pole pro jednoduché vyhledávaní. Dotaz na vyhledáváni je možné provést postupným problikáváním přes kategorii a sbírky, a následně zadáváním klíčových slov do vyhledávacího pole. Špatnou zvolenou kategorii se da smazat odkliknutím v sekci „Použita omezeni“. Bohužel vyhledávácí pole neumožňuje použití žádných booleovských operátorů nebo jiné syntaxi, která byla popsaná v oddílu 2.1.3. Syntax, operátory. (6)

Výsledky vyhledáváni obsahuji krátkou část textu, seznam autorů a rok vydání dokumentu. Navedením na ikonku s písmenem i (viz Obr. 7) se zobrazí podrobné informace o dokumentu. Informace, které mohou být nalezené v popisu dokumentu jsou typ dokumentu, ISBN/ISSN, rok, jazyk, abstrakt, klíčová slova, práva, instituce, link na externí umístěni souboru a na umístěni v digitálním repozitáři NUŠL. 

Obr. 7 Obrazovka výsledků hledání v centrálním rozhraní NUŠL. Zdroj: (7)

2.3. Typologie dokumentů

NUŠL používá vlastní typologii šedé literatury. Názvy typu dokumentů odpovídají názvům sbírek o kterých už bylo zmíněno výše. Přehledně všechny typy dokumentu jsou zobrazené na Obr. 8. (3)

Obr. 8 Typologie dokumentů. Zdroj: vlastní zpracování, (3)

3. Závěr

Národní uložiště šedé literatury (NUŠL) (7, 8) má obrovský přínos pro vědeckou a výzkumnou činnost, jelikož umožňuje publikovaní, archivovaní a síření výstupy různých producentů informaci. Šedá literatura obsahuje velké množství cenných údajů, které jsou nezbytné pro vědecké a výzkumné účely. Do těchto cenných údajů se řadí zprávy vládních a akademických orgánů, výroční zprávy firem, autorské monografie a sborníky, konferenční materiály atd.

Jedním z přínosu šedé literatury je urychlené zveřejnění materiálů než u klasických publikovaných dílů. Často také výsledky výzkumů jsou popsané podrobněji ve vědeckých zprávách a sbornících než v odborných časopisech. Nakonec některé materiály nemusí být nikdy opublikované, proto jsou takové uložiště šedé literatury velice důležité.

Uložiště šedé literatury má velký přinos nejen pro uživatele, ale i pro producenty, kteří se rozhodli spolupracovat a sdílet své dokumenty. Díky NUŠL jejích autorské díly budou sdílené veřejností a nebudou se obtěžovat byrokratickým omezením. Zveřejněné výsledky výzkumu mohou kromě toho pomoct i vládním organum, které financují tyto výzkumy, vybudovat důvěru s veřejnosti.

Kromě samotného zajištění publikace a archivace dokumentů, NUŠL také podporuje diskuse o šedé literatuře provedením každoročních konferencí.

Použité zdroje:

  1. NUŠL, 2016. Hlavní strana – Národní úložiště šedé literatury (NUŠL). NUŠL [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/
  2. NUŠL, 2016. Definice šedé literatury. NUŠL | Národní úložiště šedé literatury [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/seda-literatura/definice-sede-literatury
  3. NUŠL, 2016. Typologie dokumentů NUŠL. NUŠL | Národní úložiště šedé literatury [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/nusl/typologie-dokumentu-nusl
  4. NUŠL, 2016. Technické řešení NUŠL. NUŠL [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/nusl/technicke-reseni
  5. NUŠL, nedatováno. Průvodce vyhledáváním – Digitální repozitář. NUŠL | Digitální repozitář [online]. [Viděno 7 prosinec 2021]. Získáno z: https://invenio.nusl.cz/help/search-guide
  6. PEJŠOVÁ, Petra, 2010. Národní úložiště šedé literatury (NUŠL). Čtenář – Měsíčník pro knihovny [online]. květen 2010. [Viděno 7 prosinec 2021]. Získáno z: https://www.svkkl.cz/en/ctenar/clanek/2033
  7. NUŠL, nedatováno. Národní úložiště šedé literatury. NUŠL | Národní úložiště šedé literatury [online]. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.cz/
  8. NUŠL, nedatováno. Národní úložiště šedé literatury – Digitální repozitář. NUŠL | Digitální repozitář [online]. [Viděno 7 prosinec 2021]. Získáno z: http://invenio.nusl.cz/
  9. Kontakty, 2016. NUŠL – Národní úložiště šedé literatury [online]. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/kontakty

WolframAlpha: answer engine a znalostní báze s triliony dat

0
geometric shape digital wallpaper

Úvod

WolframAlpha je dotazovací služba vytvořena a provozována společností Wolfram Research,
kterou založil a vlastní Stephen Wolfram. Wolfram Alpha by se dal také označit jako answer
engine či computational knowledge engine. Jeho vznik se datuje do roku 2009, kdy byl poprvé
spuštěn. Samotný projekt Wolfram Alpha je založen na Wolframovo dřívějším projektu s
názvem Mathematica. Wolfram Mathematica je proprietární softwarová aplikace, která slouží k
matematickému modelování. V současnosti je také provozována společností Wolfram Research.
Každý měsíc navštíví Wolfram Alpha přes 19 milionů uživatelů [1]. Wolfram Alpha existuje ve
2 verzích, první je free verze a druhá je placená PRO verze. PRO verze je dostupná v několika
variantách, včetně verze pro studenty, která je výrazně zlevněná [2].

Popis Wolfram Alpha

Samotný projekt Wolfram Alpha měl jako myšlenku Stephen Wolfram přes 30 let, až díky
technologickému pokroku a této vizi mohl být Wolfram Alpha v roce 2009 spuštěn [3]. Wolfram
Alpha se skládá ze 2 základních stavebních kamenů. Těmito 2 kameny jsou programovací
jazyk Wolfram a přístup neboli paradigma nazývající se NKS (A New Kind of Science) [3].
Wolfram jazyk byl vyvíjen pro softwarovou aplikaci Wolfram Mathematica, z níž se posunul
dále a byl použit pro samotný Wolfram Aplha. Jazyk Wolfram zastává ve Wolram Alpha 3
základní funkce [3]:

• poskytuje strukturu ve které je celá báze znalostí reprezentována a veškeré příkazy jsou
implementovány,
• poskytuje výpočetní základ díky kterému je možné implementovat různé algoritmy a
metody,
• poskytuje silné technické zázemí.

Jazyk Wolfram je více než 35 let starý a stále se vyvíjí [3]. Momentálně se nachází ve verzi
12.3. Každou verzí dochází k přidání několika funkcí. Další klíčovou částí Wolfram Alpha je
NKS. Díky algoritmům a myšlenkám, které vycházejí z NKS je možné je využívat pro Wolfram
Alpha. NKS je paradigma, které je vyvinuto Wolframovo společností Wolfram Research [3].
NKS není přímo součástí Wolfram Alpha jako Wolfram jazyk, ale Wolfram Alpha staví na
výzkumu a vývoji, který vyšel ze NKS.

Obrázek 1.1: Princip Wolfram Alpha [1]

Wolfram Alpha je kromě webové aplikace také dostupný na několika zařízeních jako mobilní
aplikace (iOS, Android, Windows Phone). Ta je ovšem placená a stojí 80 korun, ovšem nejedná
se o měsíční ani roční předplatné, jakmile aplikaci zakoupíte zůstane vám navždy. Mezi další
mobilní aplikace patří různé doprovodné aplikace pro vzdělávání. Lze také využít rozšíření do
prohlížečů (Firefox, Chromium), které umožní rychle a pohodlně vyhledávat dotazy.
Wolfram Alpha nabízí také řešení pro soukromé firmy. Firmy tak mohou Wolfram Alpha
využít ve svých aplikacích a dokonce je možné nasadit Wolfram Alpha do firemního intranetu
jako přímou kopii. Wolfram Alpha se dá také využít k analýze a modelování rozsáhlých dat.
Placená verze zvaná Wolfram Alpha PRO umožňuje navíc oproti Basic verzi několik věcí [2]:

zobrazení krok po kroku při výpočtů,
kalkulačky pro osobní finance, výživu atd.,
dvojnásobný čas na výpočet,
2MB limit pro nahrávání souborů a jejich analýzu,
customizace výstupů a možnost stahovat výsledky.

Kromě Pro verze je také k dispozici Pro Premium verze. Ta má navíc expresní podporu od
Wolfram Alpha expertů a rozšířené limity pro výpočetní čas a velikost souborů [2]. Cena
těchto dvou verzí se liší o skoro polovinu. PRO verze stojí 6,99 USD a Pro Premium 12 USD.
Nejpopulárnější je verze Pro [2]. Cena pro studenty a ostatní se snižuje v případě zakoupení
ročního či semestrálního předplatného. Mobilní aplikace stojí 2,99 USD, její výhoda je v tom,
že ji máte navždy.

Obrázek 1.2: Logo Wolfram Alpha [1]

K úpravě uživatelských preferencí (jednotky, lokace, čas, velikost textu) lze využít vytvoření
Wolfram účtu, pomocí kterého jde tyto preference měnit a také k uchovávání nahraných a
stažených dat.

Funkce Wolfram Alpha

Wolfram Alpha nabízí mnoho rozličných funkcí ze spousty oblastí lidského poznání. Pod
dominantním logem se nachází část pro zadávání dotazů. Dotazy můžeme zadávat bud pomocí
přirozeného jazyka, nebo lze využít matematický zápis pro vložení speciálních znaků (například
pro výpočet integrálů, derivací atd.). Také lze využít nahrání souboru s daty, které posléze
Wolfram Alpha zanalyzuje. Jako poslední možnost se zde nachází i vygenerování náhodného
dotazu. Pod polem pro zadávání dotazů se ještě nachází možnost „Extended Keyboard“, ta
nám umožňuje vložit speciální znaky jako písmena řecké abecedy.

Pod dotazovacím polem se nacházejí jednotlivé oblasti, které Wolfram Alpha umí zpracovávat.
Mezi tyto oblasti patří [1]:
Matematika,
Věda & Technologie,
Společnost & Kultura,
Každodenní život.

Obrázek 2.1: Wolfram Alpha [1]

Jednotlivé oblasti jsou dále členěny do subkategorií jak je vidět na obrázku. Pro zadání dotazu
ho stačí napsat do příslušného pole a stisknout enter. Podle složitosti dotazu poté proběhne
výpočet, ale většinou je to během několika sekund. Kromě řešení námi zadaných problémů dokáže Wolfram Alpha problémy také generovat. Funkce jež se tímto zabývá se nazývá Wolfram Problem Generator [4]. Slouží primárně pro generování matematických příkladů, od
primitivních až po komplexní.

Obrázek 2.2: Wolfram Problem Generator [4]

Kromě generování problémů umí Wolfram Alpha také poskytnout příklady pro jednotlivé
kategorie a subkategorie.

U matematických příkazů můžeme vidět konkrétní postupy a jednotlivé kroky, které bychom
jako uživatelé měli při výpočtu udělat. Pomůže nám to tak v pochopení dané problematiky.
Bohužel se tato funkce nachází pouze ve verzi PRO a ve mobilních aplikacích, které jsou taky
placené.

Pro pokročilé uživatele a vývojáře je také k dispozici API, která je do 2000 dotazů měsíčně
zdarma [5]. K dispozici je několik přednastavených API jako Summary Boxes API, Spoken
Results API a mnoho dalších. Kromě přednastavených API je možno také využít Full Results
API, která pokrývá vše jako klasický Wolfram Alpha. Odpověď Full Results API je standardně
v JSON či XML a můžeme ji využít v našich aplikacích.

Vyhledávání ve Wolfram Alpha

Při vyhledávání využíváme přirozený jazyk pomocí kterého zadáváme dotazy do vyhledávacího
pole. Následující příklad ilustruje odpověď při zadání Goodfellas. Odpověď, kterou nám
Wolfram Alpha poskytne je strukturována do několika bloků. Hned první je blok Input
interpretation. Ten představuje pochopení a interpretaci dotazu samotným Wolframem. Tento
blok je první a zobrazí se u každého dotazu. Poté je blok se základními informacemi. U většiny
netechnických dotazů je také uveden graf počtu návštěv na Wikipedii v čase. U některých
bloků lze také přímo zobrazit zdroje ze kterých Wolfram Alpha čerpal. Kromě toho lze ještě
celé bloky informací zobrazit jako plain text pro snadné kopírování. V PRO verzi je možno
navíc data stahovat a vizuálně upravovat [2]. Odkaz na dotaz.

Obrázek 3.1: Goodfellas [6]

Wolfram Alpha dokáže zobrazovat obrázky, mapy, grafy. S Wolfram Alpha se můžeme rychle
dostat k několika zajímavým výsledkům. Například porovnávání jídla a jeho nutričních a
dalších informací s dotazem whopper vs baconator vs big mac (obrázek 3.2). Odkaz na dotaz.

Obrázek 3.2: Nutriční srovnání [7]

Wolfram Alpha dokáže porovnat jednotlivé dotazy, například jednotlivé dotazy srovná do
tabulek a jsou tak přehledně zobrazeny (obrázek 3.3). Odkaz na dotaz.

Obrázek 3.3: Letadla [8]

Mezi další ukázky patří například převedení libovolného textového stringu na Morseův kód
(obrázek 3.4). Odkaz na dotaz.

Obrázek 3.4: Morseovka [9]

Analýza jmen a jejich použití v populaci a další statistiky (obrázek 3.5). Odkaz na dotaz.

Obrázek 3.5: Jména [10]

Jak už bylo zmíněno kromě zadávání přirozeného jazyka lze zadávat i matematické formule. K
vložení těchto formulí je k dispozici speciální položka Math Input. Po kliknutí nám předvyplnění
náš dotaz s danou formulí a my potřebujeme doplnit jenom čísla či proměnné (obrázek 3.6).
Odkaz na dotaz.

Obrázek 3.6: Matice [11]

Předpověď počasí přímo v mobilní aplikaci na Androidu.

Obrázek 3.7: Mobilní aplikace [12]

Zdroje Wolfram Alpha
Wolfram Alpha při svých výpočtech čerpá z nejrůznějších zdrojů. Mezi ty se řadí databáze,
encyklopedie, knihy, novinové články, velkým zdrojem jsou také americké státní organizace
[1]. Přesný výčet všech zdrojů není ani k dispozici, protože se konstantě mění, například data
o počasí či finanční ukazatele. Většina zdrojů se řadí k tzv. primárním zdrojům. U každého
dotazu je možné zobrazit odkud WA čerpal. Tato položka se nachází až na samotném konci
dotazu a jmenuje se Sources (obrázek 4.1). Mezi zajímavé zdroje patří například Americká
letecká agentura, Best Buy, CIA Worl Factbook, Dow Jones.

Obrázek 4.1: Wolfram Alpha [1]

Závěr

V tomto reportu o zdroji byl popsán vyhledávač Wolfram Alpha. Byla popsána jeho historie,
funkce, vyhledávání a zdroje. Wolfram Alpha se stále rozvíjí a přináší nové funkce v každé
nové verzi

Použitá literatura
1. WOLFRAM ALPHA LLC. Wolfram|Alpha: Making the world’s knowledge computable
[online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https://www.wolframalpha.com (cit.
na s. 3–6, 14).
2. WOLFRAM ALPHA LLC. Pricing Plans [online]. 2021-02-19 [cit. 2021-12-03]. Dostupné
z: https://www.wolframalpha.com/pro/pricing (cit. na s. 3–5, 8).
3. WOLFRAM ALPHA LLC. About Wolfram|Alpha [online]. 2021-02-19 [cit. 2021-12-03].
Dostupné z: https://www.wolframalpha.com/about (cit. na s. 4).
4. WOLFRAM ALPHA LLC. Wolfram Problem Generator: Unlimited AI-generated Practice
Problems [online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https://www.wolframalpha.
com/problem-generator (cit. na s. 6, 7).
5. WOLFRAM ALPHA LLC. Wolfram|Alpha APIs: Computational Knowledge Integration
[online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https://products.wolframalpha.
com/api (cit. na s. 7).
6. WOLFRAM ALPHA LLC. Goodfellas – Wolfram|Alpha [online]. 2021-02-19 [cit. 2021-
12-03]. Dostupné z: https://www.wolframalpha.com/input/?i=Goodfellas (cit. na
s. 8).
7. WOLFRAM ALPHA LLC. whopper vs baconator vs big mac – Wolfram|Alpha [online].
2021-02-19 [cit. 2021-12-03]. Dostupné z: https://www.wolframalpha.com/input/?i=
whopper+vs+baconator+vs+big+mac (cit. na s. 9).
8. WOLFRAM ALPHA LLC. Boeing 747, Boeing 767, Airbus A320 – Wolfram|Alpha
[online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https://www.wolframalpha.com/
input/?i=Boeing+747%2C+Boeing+767%2C+Airbus+A320 (cit. na s. 10).
9. WOLFRAM ALPHA LLC. morse code “Vysoká škola ekonomická” – Wolfram|Alpha
[online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https://www.wolframalpha.com/
input/?i=morse+code+%22Vysok%C3%A1+%C5%A1kola+ekonomick%C3%A1%22 (cit. na
s. 10).
10. WOLFRAM ALPHA LLC. karen name, james name, donald name, jennifer name
– Wolfram|Alpha [online]. 2021-02-19 [cit. 2021-12-03]. Dostupné z: https : / / www .
wolframalpha.com/input/?i=karen+name%2C+james+name%2C+donald+name%2C+
jennifer+name (cit. na s. 11).
11. WOLFRAM ALPHA LLC. 2,3,4,1,3,5,2,7,8 – Wolfram|Alpha [online]. 2021-02-19 [cit.
2021-12-03]. Dostupné z: https://www.wolframalpha.com/input/?i2d=true&i=%7B%
7B2%2C3%2C4%7D%2C%7B1%2C3%2C5%7D%2C%7B2%2C7%2C8%7D%7D (cit. na s. 12).
12. WOLFRAM ALPHA LLC. Wolfram|Alpha App for Android [online]. 2021-02-19 [cit.
2021-12-03]. Dostupné z: https://products.wolframalpha.com/android (cit. na
s. 13).