Domů Blog Stránka 16

All you can read – zprávy z celého světa

0

Dnešní svět je plný nových informací a je velmi těžké mít přehled o všech zásadních událostech, které se tu dějí. Díky elektronickým zdrojům je mnohem rychlejší dané informace získat, avšak portálů, které informace poskytují, je bohužel nepřeberné množství a mnoho z nich je neobjektivních.

All you can read je největší celosvětovou databází těchto zdrojů. Webový portál existuje od roku 2001 a počet odkazovaných stránek překračuje hodnotu 25 000 a je zde zahrnuto přes 200 zemí. Hlavně je však soustřeďován na anglicky mluvící země, zvláště pak Spojené státy americké.

Kategorie produktů

Internetový portál allyoucanread.com se touto problematikou zabývá a shromažďuje odkazy na tyto produkty:

  • Zpravodajské servery
  • Magazíny
  • Online kurzy

Hlavním tématem, kterým se All you can read zaobírá jsou online novinové stránky. Tato kategorie je společná pro každou zemi, která je zahrnuta v databázi.

Lze zde najít magazíny pokrývající 33 různých témat od světa technologií a vědy, přes sociální témata a víru, po cestování a maminky s dětmi. Tato sekce je dostupná pouze v anglickém jazyce.

Poslední kategorií je sekce online kurzů, která je zatím také poskytována pouze v anglickém jazyce. Hlavních témat je stejný počet jako u magazínu, tedy 33. Motivy však nejsou stejné! Můžeme si zde vybrat například z oborů jako jsou personální růst, business nebo životní prostředí. Kurzy mohou být jak zadarmo, tak i placené. Toto kritérium se většinou odvíjí od možnosti získání certifikátu či nikoli, kde je certifikát podmíněn finanční částkou.

Vyhledávání v All you can read

Prostředí stránky je velmi jednoduché a intuitivní. Nelze zde použít žádné pokročilé vyhledávací funkce. Jediné, co nám stránka povolí je pouze „klikat“ na ikony. Jako první možnost můžeme využít horní lišty, kde máme na výběr z pěti kategorií. Pokud si vybereme sekci, která je na obrázku 1. označena červeným obdélníkem, tak nás stránka přesměruje pouze na sekce, které můžeme najít i na hlavní „home“ stránce a to:

  • Přesměrování na hlavní stránku
  • Kategorie magazínů
  • Seznam internetových poskytovatelů zpravodajství

Poslední možností na liště je „Online Courses“ tlačítko.

Obrázek 1. Úvodní stránka portálu Allyoucanread.com. Zdroj: autorský screenshot

Další způsoby vyhledávání jsou na hlavní stránce, kde se dělí podle nabízených produktů. První možností je vyhledávání světových novin podle země. Státy jsou seřazeny v abecedním pořadí. Námi hledanou zemi můžeme vyhledat pomocí myši, nebo ji napsat a seznam nám ji sám zobrazí. Stát však musí být napsaný v anglickém jazyce.

Obrázek 2. Vyhledávání podle států. Zdroj: All you can read

Pokud chceme hledat informace na určitém kontinentu a nevíme jaké všechny státy se na daném území vyskytují, je zde možnost využití hledání právě podle kontinentů. Po rozkliknutí se nám ukáže seznam zemí v abecedním pořadí.

Obrázek 3. Vyhledávání podle kontinentů. Zdroj: All you can read

Po výběru země (v našem případě České republiky), se nám automaticky objeví seznam nejčtenějších novin v Česku, které jsou dostupné online a zadarmo. Zajímavostí je, že zde vidíme 18 různých poskytovatelů informací, což je méně než u většiny evropských zemí.

Vyhledávání v online novinových zdrojích

Obrázek 4. Seznam zpravodajských portálů v České republice. Zdroj: All you can read

Dále můžeme v detailu námi vybrané zemi hledat internetové stránky na další témata, které nás mohou zajímat. Pro Českou republiku je na výběr ze 26 kategorií, zastupující všechna odvětví od vědy, přes sport, až po počasí. Kategorie jsou opět v abecedním pořadí. Po rozkliknutí se nám objeví detail se seznamem webových stránek seřazených podle oblíbenosti.  Velmi užitečnou považuji kategorii „Job“, která odkazuje na 24 různých pracovních portálů v ČR.

Obrázek 5. Kategorie témat v České republice. Zdroj: All you can read

Poslední možností na detailu vybraného státu jsou odkazy na sousední země. Kliknutím na danou sousední zemi se nám opět objeví stránka s nejčtenějšími on-line novinami, kategorie vyhledávání dle zájmu a sousední země.

Obrázek 6. Sousedící země s Českou republikou. Zdroj: All you can read

 

Vyhledávání v magazínech

Další možností vyhledávání je sekce magazínů. Vyhledávání je obdobné jako u příkladu s novinami. Zde máme v abecedním pořadí seznam kategorií, ze kterých si můžeme vybrat. Celý proces je opět velmi snadný. Stačí si vybrat téma, které nás zajímá a kliknout na danou ikonu.

Obrázek 7. Seznam kategorií magazínů. Zdroj: All you can read

Můžeme například vybrat kategorii „Science & Technology“. Po rozkliknutí se nám ukáží další dvě možnosti vyhledávání. První jsou podkategorie v oblasti „Science & Technology“, kterých je deset. Druhou možností je pak vybraných nejlepších deset magazínů, které jsou průřezem všech deseti podkategorií.

Obrázek 8. Seznam podkategorií Science & Technology magazínů. Zdroj: All you can read

Jak již bylo zmíněno, tak portál All you can read se hlavně soustřeďuje na americký trh. Magazíny jsou toho bohužel hlavním příkladem. Téměř u všech odkazů se objevuje hláška „We are unable to process orders to your area.“ Tedy, že není možný přístup na dané stránky z České republiky. Druhou nevýhodou je fakt, že magazíny, které jsou i u nás dostupné jsou placené. Databáze nám tak může sloužit především pro inspiraci.

Vyhledávání v online kurzech

Poslední kategorií jsou vzdělávací kurzy, které jsou poskytovány online způsobem. Vyhledávání je obdobné jako u novin či magazínů, tedy klikací formou. Nabídka kurzů je opravdu ohromná, stejně tak jako podkategorií pod každým tématem. Bohužel zde není žádné vyhledávací pole nebo filtr, kam bychom zadali údaje jako například obor, poskytovatele, obtížnost kurzu apod. Po výběru hlavního tématu kurzu se nám otevře podsekce možných kurzů.

Obrázek 9. Seznam online kurzů. Zdroj: All you can read

Pro ukázku je vybrán obor „Data Science“. Jak můžeme vidět, portál nám nabídl 12 různých podoborů týkajících se toho tématu. Zde je opět potřeba kliknout na námi chtěný.

Obrázek 10. Témata v rámci Data Science online kurzů. Zdroj: All you can read

Následně se nám opět zobrazí nabídka možných kurzů, seřazených od nejlépe hodnocených. Další zajímavou funkcí je lišta s obtížností daného kurzu. Online kurzů na datovou analytiku je vcelku neuvěřitelných 192.

Obrázek 11. Seznam Data Science online kurzů. Zdroj: All you can read

Srovnání výsledků

Pro srovnání, zda se jsou odkazy na internetové zpravodajství relevantní a správné, jsem použil digitalnewsreport.org, která se zabývá porovnáním a trendem informačních zdrojů v jednotlivých zemích již od roku 2012. Digital News Report je výzkumná organizace Reuters institute v kolaboraci s oborem žurnalistiky na Oxfordské univerzitě, ale také s dalšími akademickými partnery. (Digital News Report, 2020)

Na obrázku níže můžeme vidět, že portál All you can read vůbec nezahrnul zdroje seznam.cz a Česká televize online. Naopak zahrnul parlamentnilisty.cz, které Digital News Report do své analýzy zařadil jako nedůvěryhodné.

Obrázek 12. Srovnání výsledků. Zdroj: Digital News Report

Závěr

Stránka je velmi užitečná pro každodenní rychlý přehled o dění ve světě. Bohužel však neznamená, že nejpopulárnější noviny musí být nejobjektivnější, což portál All you can read nezohledňuje. Mezi nejčtenější noviny zařadil i pochybná media stejně tak jako sportovní stránku sport.cz, která se zabývá pouze zpravodajstvím v oblasti sportu. Velikou výhodou je nepřeberné množství kategorií. Je to skvělý nástroj k poznání nejen novinových zdrojů, ale i kultury a pracovních příležitostí v dané zemi. Úloha magazínů je pro české uživatele zatím bohužel zbytečná. Může opět sloužit pro inspiraci, avšak reálné využití je minimální. Další skvělou funkcí je nabídka online kurzů. Odkazů na ně je téměř nekonečno, což je velmi inspirující pro další vzdělávání v různých oborech.

Bohužel systém vyhledávání je možná až zbytečně jednoduchý, tedy pouhé klikání na ikony. Pokud si uživatel chce najít stránku v České republice, která se zajímá o vědu, musí se proklikat přes zprávy v ČR, najít obor „Science“ a následně až přejít na danou stránku. Pokud by si přál přejít na stejný obor například v Mexiku, musí se uživatel vrátit na hlavní stránku a projít stejnými kroky, akorát pro Mexiko.

Zdroje

AllYouCanRead. 2021. The Homepage for News Addicts. AllYouCanRead – The Homepage for News Addicts [online]. [cit. 09.02.2021]. Dostupné z: https://www.allyoucanread.com/

Digital News Report. 2020. Czech Republic – Reuters Institute Digital News Report. Reuters Institute Digital News Report [online]. [cit. 09.02.2021]. Dostupné z: https://www.digitalnewsreport.org/survey/2020/czech-republic-2020/

 

Quandl.com, jednoduchý prístup k finančným a alternatívnym dátam

0

Úvod

Žijeme v dobe, keď najhodnotnejšou komoditou na svete sú dáta. A práve v dnešnej informatickej spoločnosti, keď sa dáta produkujú neuveriteľne rýchlim tempom, je kľúčovou otázkou pre každý podnik, ktorý sa snaží byť konkurencie schopný na konkrétnych trhoch, či má prístup ku kvalitným, relevantným a dobre predspracovaným dátam a či sú schopný z nich extrahovať podstatné informácie užitočné pre ich biznis. 

Preto je zásadné mať poznanie o tom, kde je možné sa dostať práve k takýmto dátam, nakoľko verejne prístupných dát je obrovské množstvo, ale kvalitných a využiteľných je len malé percento z nich. V takejto situácii je potrebné siahnuť po spoľahlivých a overených poskytovateľoch dát.

Čo je Quandl.com

Quandl je verejne dostupný informační zdroj, ktorý poskytuje svojím užívateľom veľké množstvo finančných, ekonomických a alternatívnych dát. Tieto dáta sú generované spoľahlivými partnermi portálu Quandl, avšak tento portál dáva príležitosť aj novým firmám prispievať dátami, ktoré budú dostupné z tohto informačného zdroja. Podľa oficiálneho popisu tohto portálu, je cieľom Quandlu inšpirovať zákazníkov k novým objavom a začleniť ich do obchodných stratégií na základe dát nimi poskytovanými.[1]

História

Tento informační zdroj vznikol v roku 2013, keď pri svojom vzniku poskytoval prístup k viac ako miliónu dostupných dátových množín. Postupne na Quandli pribúdal počet poskytovateľov dát až do bodu, keď momentálne je cez tento informačný zdroj dostupných vyše 25 miliónov dátových množín pričom denne sa ich z tohto portálu stiahne viac ako 10 miliónov. Aktuálne je tento portál využívaný 400 000 užívateľmi. [1]

Vyhľadávanie dátových množín a možnosti filtrovania

Spôsob ako je možné sa dopracovať k žiadaným dátam v portály Quandl, je pomocou prehľadávania databáze dátových množín pomocou zadania slovného spojenia, ktoré chceme aby sa nachádzalo buď priamo v názve, v konkrétnom stĺpci dátovej množiny alebo v jednej zo špecifikácií konkrétnych dátových množín.

Obrázok 1: Základná stránka na prehľadávanie dát v zdroji Quandl. [zdroj: autor]

Vyhľadávač prejde cez všetky tieto parametre a následne vráti všetky dátové množiny, kde sa hľadaný výraz spomína aspoň v jednej zo spomínaných kategórií. Následne je možné výstupy ešte bližšie špecifikovať pomocou filtrov dostupných v užívateľskom rozhraní. Tieto filtre slúžia na zmenšenie celkového počtu vrátených výsledkov a pre presnejšie špecifikovania dotazu ktorý chceme prehľadávať. Filtre sú nasledovné:

  • Asset Class (trieda aktív)
  • Data Type (dátový typ)
  • Region (región)
  • Publisher (vydavateľ)

Po zadaní výrazu ktorý chceme vyhľadávať, nám vyhľadávač vráti počet dátových vzoriek ktoré vyhovujú nášmu dotazu, spolu so zobrazením dátových množín, ktoré sa najviac zhodujú so zadanou frázou.

Obrázok 2: Zobrazenie výsledkov vyhľadávania slova stocks. [zdroj: autor]

Po vrátení všetkých výsledkov vyhľadávania určitého dotazu, je následne možnosť sa bližšie pozrieť na detaily konkrétnej dátovej množiny. V detailoch každého výsledku je zobrazená štruktúra dát vo formáte, v akom sú ukladané.

Obrázok 3: Bližšie zobrazenie detailov prvej dátovej množiny pre výsledky vyhľadávania slova stocks. [zdroj: autor]

Zároveň sú v rovnakom okne zobrazené detaily o vydavateľovi konkrétnej dátovej množiny, ako aj podrobný prehľad o technických vlastnostiach dát spolu so štýlom ich indexácie.

Obrázok 4: Popis a technické detaily konkrétneho výsledku vyhľadávania. [zdroj: autor]

Veľkou výhodou je priama dokumentácia a popísanie spôsobu, ako sa konkrétna dátová množina pomocou aplikačného programového rozhrania môže natiahnuť do určitého analytického nástroju, na ktorú je odkaz priamo v hlavnom okne zobrazujúcom detaily dátovej množiny.

Typológia dát

Ako už bolo spomínané, portál Quandl disponuje veľkým množstvom finančných, ekonomických a alternatívnych dát. Avšak dátové množiny z každého zo spomínaných celkov, sú v jednom z dvoch poskytovaných dátových formátov. Pre bližšie pochopenie jednotlivých formátov, dokumentačná časť portálu Quandl poskytuje nasledovné porovnanie:

  1. Tabuľky:

    Tabuľky môžu obsahovať rôzne netriedené typy údajov (reťazce, čísla, dátumy atď.) a môžu byť filtrované podľa rôznych polí.[2]

  2. Časové rady:

    Časová rada je súbor pozorovaní alebo meraní uskutočňovaných za určité časové obdobie, zvyčajne v rovnakých intervaloch. Časové rady sa bežne zobrazujú pomocou spojnicových grafov, kde os X predstavuje dátumy a os Y ďalšie numerické pozorovania.[2]

Je ale potrebné spomenúť, že finančné dáta sa zvyčajne sledujú za určité časové obdobie a následne sa porovnávajú hodnoty za určité časové intervaly, preto sú finančné dáta poskytované informačným zdrojom Quandl typicky vo formáte časových rád a pri ostatných typoch dát sa využívajú práve tabuľky.

Využitie zdroja

Zásadná výhoda informačného zdroja Quandl oproti iným poskytovateľom verejne dostupných dát spočíva v tom, že dáta s ktorými by ste chceli pracovať nie je potrebné manuálne sťahovať a následne ich načítať do vývojového prostredia. Každý užívateľ tohto portálu pri registrácii dostane vygenerovaný jedinečný kľúč na využitie aplikačného programového rozhrania (API), ktoré slúži na priame načítavanie dát z Quandlu do rôznych populárnych programovacích jazykov ako aj do veľkého množstva rôznych iných analytických nástrojov pomocou príslušného modulu v konkrétnom nástroji.  Medzi najpopulárnejšie nástroje pomocou ktorých je možné vykonávať rôzne dátové analýzy a do ktorých je možné priamo načítať dáta z Quandlu patria:

  • Python
  • R
  • Excel
  • Ruby

Zároveň je priamo v portály Quandl dostupná podrobná dokumentácia ako správne využiť možnosti tejto funkcionality v jednotlivých nástrojoch a programovacích jazykoch.

Licencie

Informační zdroj Quandl má obrovskú zbierku bezplatných a otvorených údajov zhromaždených od rôznych organizácií: centrálnych bánk, vlád, nadnárodných organizácií a ďalších, ktoré je možné využívať bez akýchkoľvek obmedzení.[1] Avšak niektoré údaje v službe Quandl sú prémiové a prístup k nim je možné získať iba získaním statusu prémiového užívateľa, ktoré prebieha na spôsobe pravidelných mesačných platieb.

Oproti bezplatnému spôsobu užívania má prémiový užívateľ prístup navyše k využívaniu všetkých funkcionalít aplikačného programového rozhrania, ako aj rozšírené možnosti integrácie s ďalšími knižnicami a nástrojmi, sťahovanie v ľubovoľnom formáte a viac možností pre export dát a ich vizualizáciu. [2]

Potrebné je ale ešte spomenúť, že veľká časť zdrojov na Quandli je prístupná a ešte aj v istých prípadoch prémiových dátových množín, je možnosť využívať istú vzorku z celého dátového súboru.

Záver

Quandl je voľne dostupný informačný zdroj využívaný viac ako 400000 užívateľmi, ktorý poskytuje prístup k veľkému množstvu finančných, ekonomických a alternatívnych dát, ktoré by mali slúžiť profesionálom v týchto sektoroch ako podklad pre robenie zásadných rozhodnutí pre ich jednotlivé podniky. Hlavnou misiou tohto zdroju, je extrahovať hodnotu zo svetových dát.[1]

Zdroje

[1] Quandl, Home page [online]. Dostupné z: https://www.quandl.com

[2] Quandl, Guids [online]. Dostupné z: https://docs.quandl.com

Obrázok 1: Základná stránka na prehľadávanie dát v zdroji Quandl. [zdroj: autor]

Obrázok 2: Zobrazenie výsledkov vyhľadávania slova stocks. [zdroj: autor]

Obrázok 3: Bližšie zobrazenie detailov prvej dátovej množiny pre výsledky vyhľadávania slova stocks. [zdroj: autor]

Obrázok 4: Popis a technické detaily konkrétneho výsledku vyhľadávania. [zdroj: autor]

OpenGrey: Evropská databáze šedé literatury

0
Photo by psd

Šedá literatura a její hodnota

Šedá literatura zahrnuje jakékoliv dokumenty, které nebyly zveřejněny přes oficiální vydavatelské distribuční cesty, ať už v akademickém či komerčním světě. Jedná se např. o vysokoškolské kvalifikační práce, příspěvky z konferencí, informační letáky i publikace firem, neziskových organizací či vládních institucí.

Hodnotu šedé literatury si můžeme uvědomit na příkladu činnosti akademického pracovníka.  Spočítáme-li jeho oficiálně publikované články, dojdeme zpravidla k jednotkám článků za rok. Akademik se ale také podílí na výuce a vedení prací studentů, účastní se odborných konferencí a zapojuje se do dalších interních projektů své instituce. Přitom zpracovává řadu informačně bohatých materiálů. Podobně firmy nebo třeba neziskové organizace během své existence vyprodukují obrovské množství dokumentů (třeba prezentace, brožury, infografiky, výroční zprávy), ale málokterý z nich dostane podobu formálně vydané publikace.

Až po této úvaze dojdeme k tomu, že šedá literatura představuje v podstatě nekonečnou studnici informací, která má ale oproti formálním publikacím tu obrovskou nevýhodu, že nemá jednotnou podobu, označení a umístění, což značně komplikuje její dohledání a využití.

Tento problém částečně řeší řada institucí, které vybranou šedou literaturu zaznamenávají a dávají k dispozici ve specializovaných databázích. Jednou z nich je i OpenGrey.

Databáze OpenGrey

OpenGrey je otevřená databáze více než 700 000 bibliografických referencí k šedé literatuře, která vznikla na evropském území. Umožňuje reference podrobně vyhledat, exportovat a zjistit umístění daných materiálů. Zahrnuje šedou literaturu z oblasti vědy, technologií, biomedicíny, ekonomie, a také společenských a humanitních věd. Zároveň obsahuje preprinty z konferencí o šedé literatuře. Vstoupíme do ní přes doménu opengrey.eu či opengrey.org.

Seznámení s obsahem databáze

Pro vyhledávání v databázi je nezbytné používat angličtinu, jelikož všechny záznamy v databázi mají uvedeny název a/nebo klíčová slova v angličtině. Kromě toho je každý záznam opatřen tzv. SIGLE klasifikačním kódem, který záznam zařazuje do určité tematické skupiny.

V případě, že se chceme seznámit se systémem SIGLE klasifikace nebo nemáme konkrétní vyhledávací dotaz, můžeme seznámení s databází začít na záložce Subjects. Po jejím otevření se nám zobrazí kompletní seznam 22 tematických oblastí. 

SIGLE klasifikace (http://www.opengrey.eu/subjects/)

Kliknutím na jakoukoliv z nich jsme přesměrování na záložku Search, kde se nám zobrazí záznamy referencí z dané oblasti. Podrobnější třídění záznamů dle oborů můžeme prozkoumat v levé části obrazovky.

Vyhledávání podle SIGLE kódu (http://www.opengrey.eu/). Vlastní zpracování.

Vyhledávání

Častěji nás zřejmě bude zajímat konkrétní téma a budeme využívat pokročilé vyhledávání. Pokud do vyhledávače zadáme více slov, implicitně je mezi nimi vložen operátor AND. Pro ukázku použijeme spojení virtual team a dostávám 42 výsledků.

Pro upravení či zpřesnění dotazu můžeme využít řadu standardních operátorů a syntaxe. Jde o booleovské operátory (AND, OR, NOT), proximitní operátory (NEAR, NEAR/X), dále použití uvozovek pro vyhledání přesné fráze (virtual teamzúží výsledky na 6 záznamů), vyloučení slova pomocí mínusu (např. virtual team“ -survey) či použití symbolu * pro nahrazení koncové části výrazu (organisation* vyhledá tedy organisations i organisational).

Zajímavou možností je použití BEFORE/AFTER, kterými definujeme časové rozpětí (např. AFTER 2005 nalezne dokumenty vydané po roce 2005) a OPT vyhledá volitelná slova, která se mohou či nemusí v dokumentu vyskytnout. Výsledky hledání se pak srovnají tak, že záznamy obsahující toto volitelné slovo jsou řazeny jako první.

Při rozkliknutí konkrétního záznamu dostáváme veškeré dostupné informace, především tedy název, autora, rok vydání, jazyk, abstrakt (ty se začaly přidávat až od roku 1997), klíčová slova, typ dokumentu, SIGLE kód a umístění dokumentu.

Konkrétní záznam dokumentu (http://www.opengrey.eu/)

Při vyhledávání můžeme využít vyhledávání dle těchto políček, které u záznamu jsou. Nejpraktičtější bude vyhledávání v abstraktu (abstract:“virtual team“). Možností při úpravě vyhledávacího dotazu je nicméně více a jejich kompletní seznam a vysvětlení může čtenář naleznout v zápatí stránky v sekci Help (záložka Search). Na tu samou stránku odkazuje i otazník vedle vyhledávacího okna.

Další možností, jak upravovat svůj dotaz, je skrze filtry zobrazené v levé části obrazovky. Pomocí nich můžeme specifikovat dle konkrétních osob (autorú), organizací, SIGLE klasifikace, klíčových slov, roku vydání, jazyka, typu dokumentu a země jeho původu.

Export záznamu

Pro usnadnění práce s citováním můžeme využít dvou jednoduchých cest, jak si uložit bibliografický záznam námi zvolených dokumentů. Záznam můžeme exportovat ve formátu XML pomocí ikonky nad konkrétním záznamem a nebo, pokud máme předem nainstalované příslušné rozšíření, použít citační manažer Zotero.

Filtrování a rozšířené vyhledávání (http://www.opengrey.eu/). Vlastní zpracování.

Na co nezapomenout?

Ačkoliv OpenGrey a další databáze šedé literatury představují nedocenitelné pomocníky při rešerši neoficiálně publikovaných dokumentů, je nutné si uvědomit, že obsahují pouze její malý výsek. Aby se totiž určitý dokument v databázi objevil, musí jeho vlastník aktivně spolupracovat s institucí, která se zabývá archivací a zpřístupňováním literatury v dané zemi. V ČR například tuto službu poskytuje Národní technická knihovna, skrze portál nusl.techlib.cz pak můžeme prohlížet naši národní databázi šedé literatury. Pouze pokud národní instituce zároveň spolupracuje s OpenGrey, můžeme daný dokument naleznout i zde. Přesto se vyplatí tohoto volně dostupného zdroje využívat, jelikož při běžném hledání na povrchovém webu bychom se k tak bohatým informacím dostávali jen obtížně.

Použité zdroje

OpenGrey databáze. Dostupná z http://www.opengrey.eu/

Tableau Public: Aby dátam rozumeli všetci

0

Úvod

V dnešnom svete je dostupné neuveriteľné množstvo dát. Tieto dáta sa neustále generujú z rôznych systémov po celom svete. Ak by sme ich však nevedeli spracovať, filtrovať, upravovať a dolovať z nich vzácne informácie, ktoré vieme ďalej využiť v nás prospech, boli by tieto dáta zbytočné. Nestačí však, že im rozumejú odborníci a vedci. Je potrebné, aby dátam rozumeli aj bežní ľudia. Práve táto myšlienka bola základným stavebným prvkom pre vytvorenie softwaru Tableau.

Tableau Public

Tableau Software je spoločnosť, ktorá sa zaoberá vývojom BI a analytického softwaru. Ich cieľom bolo vytvoriť intuitívny a ľahko ovládateľný program, pomocou ktorého bude možné pracovať s dátami aj bez vedomosti skriptovacích a programovacích jazykov. Momentálne ponúka spoločnosť rôzne self-service produkty pre rôzne skupiny zákazníkov. Medzi najznámejšie patrí Tableau Desktop, Tableau Server, Tableau Online, Tableau Public, Tableau Prep Builder, Vizable a iné produkty.

Tableau Public je platforma dostupná zadarmo, ktorá slúži pre vytváranie vizualizácii a ich následne zdieľanie. Pre používanie tohto produktu sa stačí zaregistrovať na stránkach spoločnosti a stiahnuť si aplikáciu. Tableau tiež ponúka rôzne návody a videá, na ktorých demonštrujú prácu s Tableaum. Ponúkajú aj niekoľko datasetov, ktoré si môže užívateľ stiahnuť, nahrať do Tableau a vyskúšať si s nimi, ako sa v programe pracuje.

Tableau Public je určený na prácu s verejnými dátami, neslúži pre privátne dáta. Všetky vizualizácie, ktoré sú v Tableu Public vytvorené a publikované, sú dostupné pre každého online.  Každý si tak môže tieto vizualizácie prezerať, poprípade sťahovať a učiť sa na nich, ako boli vytvorené [1].

Nahranie a prvotná úprava dat

Na nahranie dát do Tableau slúži záložka Data Source. Dáta je možné nahrať v rôznych formátoch, napr. to môže byť JSON súbor, textový súbor, Access databáza, Excelovský súbor, PDF a iné. Okrem toho umožňuje Tableau na nahraté dáta nahliadnuť a upraviť ich. Stĺpce sa dajú oddeliť alebo spojiť, premenovať apod.

Často sa stáva, že pre analýzu je potrebné použiť dáta z viacerých datasetov. Na spojenie viacerých zdrojov slúžia funkcie JOIN (spojenie stĺpcov pri rovnakých riadkoch) a UNION (spojenie riadkov pri rovnakých stĺpcoch). Pri použití funkcie JOIN stačí uložiť vedľa seba, určiť typ joinu a stĺpce, ktoré vo vybraných zdrojoch obsahujú rovnaké záznamy a budú slúžiť na prepojenie (Obrázok 1). Pri funkcii UNION sa vybrané zdroje uložia na seba, pričom musia mať zhodné názvy stĺpcov (Obrázok 2).

Obrázok 1: Ukážka joinovania dvoch zdrojov [1]
Obrázok 2: Ukážka unionu dvoch zdrojov [1]

Tvorba grafov

Pre samotnú prácu a tvorbu grafov sa v Tableau nachádza záložka Worksheet.

Na Obrázku 3 vidíme príklady metrík a dimenzií, ktoré sa nachádzajú v použitom dátovom zdroji. Symbol pri každom atribúte značí o aký typ údaju sa jedná, farba označuje či ide o spojitú (zelená farba) alebo diskrétnu (modrá farba) premennú. S metrikami a dimenziami je možné ďalej pracovať, upravovať ich, zmeniť názov, dátový typ či ich zduplikovať. Dimenzie môžu byť konvertované na metriky, metriky na dimenzie, spojité na diskrétne a naopak. Ďalej je možné atribúty zgrupovať, vytvárať rôzne intervaly, či kalkulované polia pomocou rôznych funkcií. Tableau ku tomu poskytuje nápovedu, viď Obrázok 4.

Obrázok 3: Zobrazenie metrík a dimenzií [1]
Obrázok 4: Vytvorenie kalkulovaného poľa [1]

Ovládanie v Tableau nevyžaduje znalosť žiadneho programovacieho jazyka, je postavené na princípe drag&drop. To znamená, že pre vytvorenie grafu, stačí vybrať metriku a dimenziu a pretiahnuť ju do vybraného poľa alebo plátna. Výber metriky či dimenzie funguje aj dvojklikom. V tomto prípade sa vybraná metrika alebo dimenzia dosadí do poľa, ktoré je podľa Tableau najvhodnejšie. Odstránenie a presunutie vybraných dimenzií či metrík funguje na podobnom princípe.

Na Obrázku 5 je zobrazená plocha Worksheetu. Polia „Columns“ a „Rows“ predstavujú miesta, kam sa vkladajú metriky a dimenzie. Podľa ich umiestnenia sa potom na plátne vykreslí graf. Pole „Filters“ je určené taktiež pre vkladanie dimenzií a metrík, podľa ktorých bude možné obmedziť výber záznamov, ktoré sa zobrazia v grafe. Filtrom je možné prispôsobovať nastavenia, v ponuke je napríklad Slider (Obrázok 6), Dropdown Single Value (Obrázok 7), List Multiple Values (Obrázok 8), ale určuje sa aj či sa označené hodnoty majú v grafe zobraziť alebo vynechať apod.

Obrázok 5: Plocha Worksheetu [1]
Obrázok 6: Slider [1]
Obrázok 7: Dropdown Single Value [1]
Obrázok 8: Multiple Values [1]

Pole „Marks“ obsahuje viacero funkcií, ktoré umožňujú ďalšiu prácu s grafom. Opäť sa do všetkých polí vkladajú metriky alebo dimenzie a následne sa graf upraví nasledovne:

  • funkcia Color prispôsobí farby grafu (príklad: najtmavšie zobrazená bude sopka, ktorá najčastejšie vybuchuje)
  • funkcia Size ovplyvní veľkosť alebo šírku zobrazenia záznamov v grafe (príklad: najväčšia na mape bude sopka, pri ktorej výbuchoch sa zranilo najviac ľudí)
  • funkcia Detail umožňuje vybrať level detailu zobrazenia grafu
  • funkcia Tooltip zas umožní zobrazenie dodatočných informácii pri pohybe kurzorom nad grafom (v rámci Tooltipu je možné zobraziť aj vizualizácie)
  • funkcia Label pridá ku grafu popisky

Tableau ponúka veľké množstvo rôznych grafov. Na výber je napríklad tabuľka, tabuľka so zvýraznenými bunkami, histogram, koláčový graf, tepelná mapa, klasická mapa, stĺpcový, spojnicový, krabicový či bodový graf. Dostupné sú podľa toho, aké má užívateľ k dispozícii dáta, ktoré metriky a dimenzie chce použiť (je možné ich označiť pomocou klávesy ctrl). Na základe týchto údajov Tableau užívateľovi odporučí najvhodnejší graf, a ten ohraničí červenou farbou. Zvýrazní však všetky grafy, ktoré budú s daným výberom fungovať a znemožní výber tých, ktoré pri daných údajoch využiť nejde. Pri každom grafe naviac Tableau užívateľovi „našepká“, koľko metrík a koľko dimenzií musí byť použitých, aby bolo možné graf zobraziť. Ponuka týchto grafov je ukrytá pod tlačítkom „Show me“, viď Obrázok 9.

Obrázok 9: Ponuka grafov [1]

V každom Worksheete sa dá zobraziť jeden graf. Potom čo sú grafy hotové, je možné ich kombinovať a vytvoriť Dashboard.

Tvorba dashboardov

Plocha dashboardu je podobná ako plochá Worksheetu. Na ľavej lište sú zobrazené jednotlivé možnosti, ktoré Tableau pri tvorbe dashboardu ponúka. Patrí tu napríklad nastavenie veľkosti plochy alebo zoznam Worksheetov a objektov, ktoré je možné použiť. V dashboarde je možné pomenovať jednotlivé grafy, samotný dashboard, pridať alebo vymazať filtre, prispôsobiť rozloženie grafov, popiskov, filtrov. Tableau umožňuje do dashboardu vložiť obrázky, text, popis, odkaz na webovú stránku a pod. Tableau tiež ponúka mnoho možností formátovania, nastavenia farieb a fontov. Na Obrázku 10 je ukážka jednoduchého dashboardu vytvoreného z dvoch grafov, resp. dvoch worksheetov.

Obrázok 10: Príklad dashboardu [1]

Pre pridanie interaktivity do dashboardu umožňuje Tableau grafy navzájom prepojiť pomocou filtrov alebo highlightov. Filter sa zaktivuje kliknutím na symbol lievika pri grafe. To spôsobí, že druhý graf sa upraví podľa výberu na grafe, pri ktorom je zapnutý filter, viď Obrázok 11. Vďaka tomuto nastaveniu je možné sa bližšie pozrieť len na výsledky, ktoré nás zaujímajú.

Obrázok 11: Ukážka filtrovania [1]

Funkcia Highlight funguje podobne ako funkcia Filter. Rozdielom je, že vybrané záznamy sa zvýraznia, a nevyhovujúce záznamy z grafu nezmiznú, ale ostanú v pozadí, viď Obrázok 12. Táto funkcia sa nachádza v menu Dashboard/Actions/Add Action/Highlight, kde sa nastavia potrebné parametre.

Obrázok 12: Ukážka highlightu [1]

Tableau ponúka aj tzv. Device Designer. Táto funkcia umožňuje prispôsobiť a upraviť dashboard podľa typu zariadenia, na ktorom sa bude zobrazovať. Pri zobrazení dashboardu na mobile je tak možné zmenšiť/odstrániť určité prvky, ktoré by neboli dobre viditeľné na malom displeji, naopak pri zobrazení na desktope zas môžeme nejaké prvky pridať/zväčšiť.

Tvorba príbehov

Vytvorené závery z dat je potrebné nejakou formou prezentovať. Publikovať sa dajú individuálne Worksheety a Dashboardy, ale Tableau ponúka aj ďalšiu funkciu, a to tzv. tvorenie príbehov (záložka Story). Funguje ako prezentácia, do ktorej sa vložia rôzne Worksheety a Dashboardy, ktoré tvoria „story points“, teda jednotlivé časti príbehu.

Hárok pre tvorenie príbehov vyzerá takmer identicky ako hárok pre tvorbu dashboardov. V ľavej lište sú zobrazené možné nastavenia, dostupné Worksheety a Dashboardy a ďalšie použiteľné objekty. Worksheety a Dashboardy sa len pretiahnu na plochu v ľubovoľnom poradí. Pridať je možné popisy a názvy, aby bolo čitateľovi jasné, čo má príbeh vyrozprávať. Odporúča sa začať od všeobecnejších pohľadov k detailnejším alebo naopak. Opäť sú tu dostupné rôzne možnosti formátovania, ktorými docielime to, aby bol príbeh zaujímavejší či estetickejší.

Ukladanie a publikovanie

Všetky vytvorené vizualizácie je možné ukladať na Tableau Public profil. Odtiaľ sa potom dajú zdieľať a vkladať na akékoľvek ďalšie stránky. Uložia sa všetky worksheety, dashboardy a príbehy, ktoré sú v jednom zošite vytvorené a zobrazia sa v takom stave, v akom sú v Tableau v čase uloženia. Ako prvá vizualizácia sa čitateľom na profile zobrazí tá, ktorú máme pri ukladaní aktívnu, resp. zobrazenú.

Všetky uložené vizualizácie sú defaultne dostupné pre každého registrovaného užívateľa. Toto nastavenie je však možné pri každej publikovanej vizualizácii zmeniť.

Záver

Tableau je skvelý nástroj na vizualizáciu dát. Dobrá vizualizácia môže pomôcť získať z dát cenné informácie a pomôcť tak pri procese rozhodovania. Tableau Public je voľne prístupné s určitými obmedzeniami. Aj keď je určené na prácu s verejnými dátami a všetky publikované vizualizácie sú verejné, môžu ho využiť napríklad ľudia, ktorí si nemôžu dovoliť zaplatiť licenciu a chceli by sa s Tableaum naučiť pracovať. V tejto práci sú predstavené základné funkcie, ktoré Tableau Public ponúka. Okrem nich, je tu dostupných mnoho ďalších funkcií, ktoré sa dajú najlepšie naučiť pri samotnej práci s Tableaum.

Zdroje

[1] Tableau Software, LLC, a Salesforce Company [online]. 2021 [cit. 2021-02-10]. Dostupné z: https://public.tableau.com/s/

Data.gov.uk – přístup k otevřeným datům ve Spojeném království

0

Úvod

Data.gov.uk [1]vznikl jako projekt vlády Spojeného království, který měl volně zpřístupnit a dát možnost využívat otevřená data vlády Spojeného království široké veřejnosti. Projekt byl spuštěn v lednu 2010 a k prosinci 2020 obsahuje 55 487 data setů. Data.gov.uk je zároveň uveden v registru úložišť výzkumných dat – Registry of Research Data Repositories[2].

V březnu 2018 projekt spustil službu „Find open data“, pomocí které je možné najít data zveřejněná ústřední vládou, místními úřady a veřejnými orgány. Dále je možné najít odkazy ke stažení datových souborů, případně je možné vytvořit účet k publikování dat (zejména pro organizace).

Qwant: ďalší vyhľadávač, ktorý rešpektuje súkromí

0

Na vzniku Qwantu sa podieľali v roku 2011 traja Francúzi – Éric Léandri, Jean-Manuel Rozan a Patrick Constant. Ich hlavnou prioritou bolo priniesť na trh vyhľadávač, ktorý bude bezpečný a nekontrolovaný.
Webový vyhľadávač Qwant bol spustený v roku 2013. Hlavnou devízou je fakt, že nesleduje aktivitu používateľov a nezhromažďuje o nich žiadne osobné údaje na rozdiel od najznámejších webových vyhľadávačov. Spoluzakladateľ projektu Éric Léandri preferuje neutrálny a otvorený web, ktorého cieľom nie je zisťovať identitu používateľa, jeho sexuálnu orientáciu či náboženstvo. Naopak, hlavným cieľom je doručiť efektívne vyhľadávacie služby.[1]

Qwant rešpektuje súkromie a anonymitu používateľov

Servery, na ktorých beží Qwant sa nachádzajú v Paríži. Takéto on-premise riešenie je síce  drahšie ako využívanie cloudových služieb, avšak, čo sa týka bezpečnosti a anonymity používateľov – dvoch hlavných cieľov spoločnosti Qwant, je on-premise riešenie nevyhnutné. Ako je zrejmé z vyjadrení spoluzakladateľov spoločnosti, používanie amerického cloudu by nebolo bezpečné, keďže cloudové zákony v USA umožňujú sledovať zahraničné údaje.[2]
K vyhľadávaču Qwant pristupujeme pomocou adresy https://www.qwant.com/.


Obrázok 1: Základné rozhranie Qwant vyhľadávača I
[zdroj: vlastné spracovanie]


Obrázok 2: Základné rozhranie Qwant vyhľadávača II
[zdroj: vlastné spracovanie]

Aké sú benefity používania Qwant vyhľadávača oproti známemu komerčnému vyhľadávaču akým je Google?

Hlavný rozdiel spočíva v súboroch cookies. Cookies sú malé súbory, ktoré uchovávajú informácie a vyhľadávač Qwant nekontroluje svojich používateľov pomocou týchto súborov. To znamená, že nezaznamenáva žiadne osobné údaje prehliadania, lokalizáciu či adresy webových stránok. Okrem toho sú výsledky vyhľadávania a počet dotazov rovnaké pre všetkých používateľov bez ohľadu na to, či sú prihlásení alebo nie a bez ohľadu na polohu, kde sa práve nachádzajú. To znamená, že pri zadaní rovnakého dotazu dvomi rôznymi ľuďmi a na rôznom mieste budú výsledky vyhľadávania rovnaké.

Ako potom funguje Qwant vyhľadávanie?

IP adresa návštevníka je pri každej relácii zašifrovaná a konvertovaná do postupnosti znakov, ktoré obsahujú náhodné čísla. Tento spôsob predchádza následnému vysledovaniu pôvodnej IP adresy.
Napokon spoločnosť Qwant sprístupňuje zdrojový kód vyhľadávača, pomocou ktorého si môžete overiť, že vyhľadávač nezachytáva žiadne údaje o klientoch.[2]

Pri výsledkoch vyhľadávania sa môžu zobrazovať reklamy. Jedná sa však o kontextové reklamy, ktoré súvisia s podstatou samotného vyhľadávania. Práve takáto reklama svedčí o ďalšom rozdiele medzi vyhľadávačmi Qwant a Google, kedy Google využíva cielené reklamy, ktoré sú založené na sledovaní používateľa – preto môžete mať pocit, že vás reklamy prenasledujú.
Spoločnosť Qwant začala vyvíjať technológiu zameranú na cielené reklamy, ktorá zohľadňuje súkromie používateľa a zároveň využíva personalizáciu. Podstatou personalizácie cielenej reklamy je ukladanie údajov na strane klienta – na jeho lokálnom zariadení, nie však na strane servera. Celý tento postup zastrešuje prehliadač Masq a pripojenie WebSocket.[3]

Vyhľadávací modul je založený na triediacich algoritmoch, ktoré majú rovnaké požiadavky a tento spôsob zaručuje, že žiadna webová stránka nedisponuje vyššou či nižšou prioritou. Qwant indexuje web bez rozdielov. Výsledky dotazov navyše neuprednostňujú ani históriu prehliadania či používateľský profil.[4]

Obrázok 3: Ukážka vyhľadávania vo vyhľadávači Qwant I
[zdroj: vlastné spracovanie]

Po zadaní dotazu je možné vyberať medzi viacerými kategóriami vyhľadávania. Konkrétne kategórie sú „Web“, „Správy“, „Obrázky“, „Videá“, „Mapy“ a „Hudba“.

Obrázok 4: Ukážka vyhľadávania vo vyhľadávači Qwant II
[zdroj: vlastné spracovanie]

Obrázok 5: Reštrikcia vyhľadávania pomocou operátorov
[zdroj: vlastné spracovanie]

Kategória „Nastavenia“ umožňuje upraviť zvolený jazyk prehliadania. Okrem toho ponúka trojúrovňové filtrovanie obsahu pre dospelých – buď žiadne, mierne alebo prísne, automatické otváranie zakliknutých odkazov na novej karte, automatické otváranie videí na novej karte, zobrazovanie trendov na domovskej stránke a zobrazovanie správ vedľa výsledkov na webe.


Obrázok 6: Panel nastavení vo vyhľadávači Qwant I
[zdroj: vlastné spracovanie]

Ďalej je možné zmeniť štýl pozadia a možnosť použiť vygenerovaný link, ktorý slúži na uloženie nastavení pre používateľov, ktorí si ešte nevytvorili účet Qwant. 


Obrázok 7: Panel nastavení vo vyhľadávači Qwant II
[zdroj: vlastné spracovanie]

Vo vyznačenom paneli si používateľ môže vybrať krajinu a jazyk prehliadania, a filtrovať dotazy v závislosti od času uverejnenia – všetky dotazy, dotazy za posledných 24 hodín, dotazy za minulý týždeň či minulý mesiac.


Obrázok 8: Ukážka vyhľadávania vo vyhľadávači Qwant III
[zdroj: vlastné spracovanie]

Rozkliknutím ikonky „Products“ v hlavnom rozhraní vyhľadávača Qwant dostávame na výber možnosti presmerovania na Qwant Junior, Qwant Maps a Qwant Music.


Obrázok 9: Rozšírené nástroje vyhľadávača Qwant
[zdroj: vlastné spracovanie]

Qwant Junior

V roku 2015 prišla spoločnosť Qwant na trh s novinkou – vyhľadávačom, ktorý je určený pre deti. Qwant Junior je vyhľadávač, ktorý filtruje nevhodný obsah. Okrem toho ponúka ďalšie špecifiká.[1]
Qwant Junior je určený predovšetkým deťom od 6 do 12 rokov. Z vyhľadávania odstraňuje i reklamy.[3]
Vyhľadávač Qwant Junior je takmer identický s jeho rodičovskou verziou Qwant. Pri prehliadaní webov sa história neukladá.[4]  K vyhľadávaču Qwant Junior pristupujeme pomocou adresy https://www.qwantjunior.com/.


Obrázok 10: Základné rozhranie Qwant Junior I
[zdroj: vlastné spracovanie]


Obrázok 11: Základné rozhranie Qwant Junior II
[zdroj: vlastné spracovanie]

Kliknutím na rozšírené možnosti nám Qwant Junior umožňuje výber jazyka, v ktorom chceme vykonávať prehliadanie, umožňuje nám meniť farbu pozadia a nahliadnuť do nastavení. Qwant Junior ponúka dva jazykové parametre. Prvý sa vzťahuje iba na jazyk používateľského rozhrania a druhý na jazyk výsledkov.


Obrázok 12: Rozšírené možnosti vyhľadávača Qwant Junior I
[zdroj: vlastné spracovanie]


Obrázok 13: Rozšírené možnosti vyhľadávača Qwant Junior II
[zdroj: vlastné spracovanie]

Qwant Junior momentálne ponúka používateľské rozhranie pre 6 krajín a 4 svetové jazyky.


Obrázok 14: Ponuka krajín používateľského rozhrania vo vyhľadávači Qwant Junior
[zdroj: vlastné spracovanie]

Po výbere krajiny si používateľ volí jazyk, v ktorom chce dostať výsledky vyhľadávania.

Obrázok 15: Ponuka jazykov prehliadania vo vyhľadávači Qwant Junior
[zdroj: vlastné spracovanie]


Obrázok 16: Zmena štýlu pozadia vo vyhľadávači Qwant Junior
[zdroj: vlastné spracovanie]

Napriek tomu, že Qwant Junior ponúka jazykové rozhranie pre 6 krajín, nie všetky kategórie vyhľadávania sú dostupné pre všetky z nich. Z kategórií „Hľadať“, „Správy“, „Učenie“, „Hranie“ a „Voľný čas“ sú pre krajiny okrem Francúzska, kde bol Qwant založený, dostupné iba prvé dve kategórie – „Hľadať“ a „Správy“.


Obrázok 17: Rozdiel v dostupnosti kategórií prehliadania v rôznych jazykových verziách vyhľadávača Qwant Junior
[zdroj: vlastné spracovanie]

Qwant Maps

Qwant Maps je aplikácia, ktorá funguje na podobnom princípe ako známejšia aplikácia Google Maps. Môžeme pomocou nej plánovať rôzne cesty a zobrazovať rôzne miesta. K službe Qwant Maps pristupujeme pomocou adresy https://www.qwant.com/maps.


Obrázok 18: Základné rozhranie Qwant Maps
[zdroj: vlastné spracovanie]

V rozšírených možnostiach Qwant Maps zadávame parametre hľadania na mapách.


Obrázok 19: Rozšírené možnosti služby Qwant Maps
[zdroj: vlastné spracovanie]

Qwant Music

Qwant Music je aplikácia od spoločnosti Qwant, ktorá umožňuje svojim používateľom vyhľadávať a prehrávať rôzne hudobné žánre. V pravej časti webovej stránky je možné nastaviť si preferovanú krajinu a jazyk prehliadania hudby. Podobne ako Qwant Junior, aj Qwant Music ponúka vlastnosť zmeny štýlu pozadia či ďalšie možnosti nastavení. K službe Qwant Music pristupujeme pomocou adresy https://www.qwant.com/music.


Obrázok 20: Základné rozhranie Qwant Music
 [zdroj: vlastné spracovanie]


Obrázok 21: Rozšírené možnosti služby Qwant Music
[zdroj: vlastné spracovanie]

Qwant Music ponúka na prehliadanie webového rozhrania širší výber krajín a jazykov ako vyhľadávač učený pre deti – Qwant Junior.


Obrázok 22: Ponuka jazykov prehliadania služby Qwant Music
[zdroj: vlastné spracovanie]

Qwant Boards

Funkcionalita Qwant Boards poskytovala používateľovi možnosť ukladať webové stránky ako poznámky na nástenku, resp. do priečinkov. Funkcionalita Qwant Boards bola vyradená z prevádzky a k dnešnému dňu ju už naďalej nie je možné využívať.[4]


Obrázok 23: Základné rozhranie Qwant Boards
[zdroj: vlastné spracovanie]

Mobilná aplikácia Qwant

Pokiaľ patríte medzi používateľov tejto platformy, spoločnosť Qwant vyvinula aj mobilnú aplikáciu vyhľadávača Qwant, ktorú si môžete nainštalovať do svojich smartfónov bez ohľadu na to, či používate operačný systém Android alebo iOS. Mobilná aplikácia Qwant garantuje ochranu proti sledovaniu a súkromné vyhľadávanie bez použitia súborov cookies.[4]

Qwant Lite

Dva roky po spustení vyhľadávača Qwant sa na trhu objavila jeho lite verzia. Qwant Lite predstavuje rýchlejšiu verziu pôvodného Qwant nástroja a je určený predovšetkým pre používateľov, ktorí využívajú staršie prehliadače a pre tých, ktorí pracujú so staršími a menej výkonnými počítačmi. Jediným hendikepom verzie Qwant Lite je odstránenie integrovaných funkcií akými sú v hlavnej verzii Qwant prehrávanie videa a JavaScript.[5]
K verzii Qwant Lite pristupujeme pomocou adresy https://lite.qwant.com/.


Obrázok 24: Základné rozhranie vyhľadávača Qwant Lite
[zdroj: vlastné spracovanie]

Qwant Blog

V neposlednom rade sa žiada spomenúť vlastný blog internetového vyhľadávača Qwant, na ktorom nájdeme rôzne témy, ktoré sa naň viažu. Malým mínusom je skutočnosť, že posledný uverejnený príspevok sa datuje na rok 2018. Tento blog nájdeme na adrese https://blog.qwant.com/.


Obrázok 25: Zobrazenie webu blog.qwant.com
[zdroj: vlastné spracovanie]

Zaujímavosti

Spoločnosť Qwant sa usiluje o uzavretie dohody s nadáciou Mozilla, kedy by sa vyhľadávač Qwant stal predvoleným vyhľadávacím nástrojom v prehliadači Mozilla Firefox.[6]

Qwant uzavrel zmluvy so spoločnosťami Zanox, TripAdvisor, eBay a LeGuide. Vždy keď sa používateľ presmeruje na tieto weby pomocou prehliadača Qwant, prípadne weby, ktoré majú pod sebou, získa spoločnosť Qwant peňažnú čiastku vo výške od 44 do 88 centov.[2]

V júni 2019 oznámila spoločnosť Qwant uzavretie zmluvy so spoločnosťou Microsoft. Kontrakt umožňuje prepojiť prehľadávače a algoritmy vyhľadávača Qwant s cloudovými službami Azure od Microsoftu s cieľom neporušiť súkromie používateľa.[7]

Štatistiky za rok 2020 ukazujú, že Qwant je 105. najnavštevovanejšou webovou stránkou vo Francúzsku a 1458. najnavštevovanejšou webovou stránkou vo svete.[8]


Obrázok 26: Rebríček vyhľadávania webovej adresy qwant.com
[zdroj: vlastné spracovanie]


Obrázok 27: Prehľad premávky návštev webovej adresy qwant.com
[zdroj: vlastné spracovanie]


Obrázok 28: Podiel návštevnosti webovej adresy qwant.com podľa krajín
[zdroj: vlastné spracovanie]

Porovnanie vyhľadávačov, ktoré nesledujú používateľov: Qwant vs. DuckDuckGo

Vyhľadávač

Qwant

DuckDuckGo

Vlastník

Qwant SAS

Duck Duck Go Inc.

Spustenie

Júl 2013

Júl 2008

Počet indexovaných stránok

20 miliárd

1,2 miliardy

Počet denných dotazov

10 miliónov

25 miliónov

Reklamy vo vyhľadávači

Nie

Nie

Bezpečnostné funkcie

HTTPS; Qwant ponúka prostredie bez súborov cookies a na vyhľadávacej platforme je zaručená ochrana súkromia používateľov

HTTPS; DuckDuckGo ponúka prostredie bez súborov cookies a na vyhľadávacej platforme je zaručená ochrana súkromia používateľov[4]


Internetový vyhľadávač Google je k dnešnému dňu najčastejšie využívaný vyhľadávač na internete a s najväčšou pravdepodobnosťou sa to ani v blízkej budúcnosti nezmení. Pokiaľ však nechcete byť monitorovaný a neprajete si, aby váš prehliadač používal súbory cookies môžete to zmeniť. Na výber máte stále širšiu ponuku vyhľadávačov, ktoré rešpektujú súkromie a anonymitu používateľov. Jedným z nich je práve Qwant.

 

 

Zoznam použitej literatúry

[1] Alumni, France. “France Alumni”. [online].  
Dostupné na: https://www.francealumni.fr/hu/page/25706/qwant-french-search-engine.

[2] EUDES, Yves. “Qwant: The Encrypted Search Engine That Really Could Challenge Google”. [online]. The World Weekly, 11. júl 2016.
Dostupné na: https://www.theworldweekly.com/reader/view/3001/qwant-the-encrypted-search-engine-that-really-could-challenge-google.

[3] LOMAS Natasha. “Private Search Engine Qwant’s New CEO Is Mozilla Europe Veteran Tristan Nitot”. [online]. TechCrunch (blog), 19. september 2019.
Dostupné na: https://social.techcrunch.com/2019/09/18/private-search-engine-qwants-new-ceo-is-mozilla-europe-veteran-tristan-nitot/.

[4] BRAY, Mikaela. “Qwant Review – How Secure Is This Search Engine for 2021?”. [online].  VPNpro, 25. január 2021.
Dostupné na: https://vpnpro.com/web/qwant-review/.

[5] Nice-Matin. “Qwant Lite est spécifiquement adapté aux utilisateurs d’anciennes versions de navigateurs”. [online]. Nice, 05. október 2015.
Dostupné na: https://www.nicematin.com/culture/qwant-lite-est-specifiquement-adapte-aux-utilisateurs-d-anciennes-versions-de-navigateurs-311041.

[6] BELFIORE, Guillaume. “Mozilla : une version de Firefox avec le moteur Qwant par défaut”. [online]. Clubic.com, 05. júl 2016.
Dostupné na: https://www.clubic.com/navigateur-internet/mozilla-firefox/actualite-811228-mozilla-firefox-moteur-qwant-defaut.html.

[7] FRANCAIX, Juliette. “Qwant et Microsoft annoncent un partenariat exclusif pour une expérience de recherche sur Internet inédite”. [online]. Paris. News Centre, 17. máj 2019.
Dostupné na: https://news.microsoft.com/fr-fr/2019/05/17/microsoft-qwant/.

[8] SimilarWeb. “Qwant.Com Traffic Statistics”. [online]. Bentima House – Seventh Floor, London, 31. január 2021.
Dostupné na: http://similarweb.com/fr/website/qwant.com/.

 

Mendeley Data – platforma pro správu a vyhledávání výzkumných dat

0

Úvod

Data jsou v dnešní době jedním z nejdůležitějších aspektů jakéhokoliv výzkumu, avšak je velice obtížné se orientovat v obrovském množství dostupných a stále přibývajících dat na internetu. Povaha a typ dat se liší od disciplíny k disciplíně a každý druh dat má většinou svou doménově specifickou hodnotu. Základní potřebou při provádění výzkumu je pak nalézt odpověď na otázky jako jsou na co, kde a jak spravovat data pro konkrétní výzkum.

A právě informační zdroje a datové repozitáře, jako je Mendeley Data, umožňují lidem objevovat, shromažďovat a sdílet výzkumná data. Usnadňují tedy mj. práci s vyhledáváním, správou, uložením a citací relevantních dat.

Platforma Mendeley Data

Mendeley Data, jakožto součást nizozemského vydavatelství Elsevier, je otevřená cloudová platforma pro správu, ukládání a vyhledávání výzkumných dat v celém jejich životním cyklu. Mendeley Data indexuje tisíce datových repozitářů buď přímo, nebo prostřednictvím DataCite [1] (globální poskytovatel DOI – z anglického Digital Object Identifier, česky „digitální identifikátor objektu“ – pro výzkumná data). To znamená desítky milionů indexovaných datasetů. 

Tato online platforma dále umožňuje sdílení citovatelných výzkumných dat, čímž pomáhá ve spolupráci s různými výzkumnými komunitami. Mendeley Data rovněž umožňuje uživatelům vytvořit skupinu pro svůj konkrétní výzkumný projekt, kde spolupracující uživatelé mohou shromažďovat, organizovat, anotovat a sdílet data na jednom místě.

Správa a sdílení dat prostřednictvím datového repozitáře jako je Mendeley Data, tak poskytuje větší publicitu datům, která mají být znovu použita legálním a vědeckým způsobem, připsáním citace. Opakovaná použitelnost dat také dává hodnotu agenturám pro financování za jejich investice do konkrétního výzkumu. [2]

Práce s Mendeley Data

Informační zdroj Mendeley Data nabízí kromě jednoduchého (volného) a pokročilého vyhledávání i tvorbu a následnou správu a archivaci vlastních datasetů.

Tvorba nových datasetů

Vytváření datasetů v Mendeley Data je jednoduchý a uživatelsky přívětivý proces. Po registraci k účtu Mendeley mohou uživatelé vytvářet nové datasety. Jednotlivé soubory lze do datasetu přidávat způsobem „drag and drop“ (přetažením souboru z jednoho místa do druhého) nebo klasickým výběrem souborů z počítače uživatele. Nahrané soubory je pak možné organizovat do složek a podsložek. Lze nahrát jakýkoliv formát souboru. Dostupné úložiště je omezeno na 10 GB na jeden dataset (viz obrázek 1).

Uživatelé jsou dále vyzváni k zadání názvu, přidání přispěvatelů a popisu a přiřazení předmětové kategorie pro dataset. Uživatelé mohou také zahrnout kroky pro reprodukci výzkumných dat zahrnutím, jak byla tato data získána (protokoly/metody). K vytvářenému datasetu je automaticky přidána citace rezervováním DOI. DOI je aktivní po zveřejnění.

Kromě toho jsou uživatelé požádáni, aby si vybrali licenci pro opětovné použití dat. Lze také přidat odkazy na související článek, dataset či software. Publikované datasety lze pak upravovat. Upravené datasety obdrží nové číslo verze. [2]

Obrázek 1 – ukázka tvorby nového datasetu (zdroj: [3], vlastní úprava)

Při vytváření nového datasetu však existují i určitá omezení: [2]

  • nelze nahrát již publikované datasety (neboli datasety s již přiděleným DOI)
  • datasety musí mít vědeckou povahu a musí sestávat z vědeckých dat
  • datasety nesmí obsahovat spustitelné soubory nebo archivy, které nejsou doprovázeny jednotlivými podrobnými popisy souborů
  • datasety nesmí zahrnovat obsah chráněný autorskými právy (audio, video, obrázky atd.), ke kterému nevlastníte autorská práva
  • datasety nesmí obsahovat citlivé informace (např. podrobnosti o pacientovi, data narození atd.)

Vyhledávání vědeckých dat

K vyhledávání datasetů a repozitářů lze využít jednoduché vyhledávání, kde na domovské stránce Mendeley Data stačí kliknout na Find Reserach Data, zadat klíčová slova do vyhledávacího pole a spustit vyhledávání.

Výsledky hledání (viz obrázek 2) se zobrazí v pravém panelu stránky a každý jednotlivý výsledek zobrazuje základní informace, jako jsou přispěvatelé, datum, zdroj ad. Podrobnější informace se zobrazí rozbalením výsledku po kliknutí na nadpis, kde se v části podrobnosti (Details) zobrazí další související soubory, pokud některé existují. Po zvolení vhodného výsledku hledání z jednotlivých náhledů lze získat přístup k úplným informacím kliknutím na More Details nebo Go to Source v závislosti na tom, co je právě prohlíženo (např. v závislosti na zdroji dat, kliknutím na Go to Source je umožněno stáhnout, citovat, sdílet nebo exportovat obsah a kliknutím na More information se otevře domovská stránka datasetu, kde je možné stáhnout soubory a mít plný přístup k metadatům).

Výsledky je také možné dále filtrovat zaškrtnutím požadovaného políčka v levém panelu stránky. Lze filtrovat podle datového typu (tabulka, dataset, obrázek, dokument, text, video audio ad.), typu repozitáře (datový nebo repozitář článků) a zdroje (na výběr je mnoho různých informačních zdrojů, např. ScienceDirect, arXiv, IEEE DataPort nebo samotné Mendeley Data). Zatímco je možné provést výběr z více možností při filtrování dle datového typu, při filtrování dle typu repozitáře a zdroje lze zvolit pouze jednu možnost. [2]

Vše je znázorněno a shrnuto na obrázku 2 – vyhledávání na horní straně a výsledky hledání na spodní straně.

Obrázek 2 – jednoduché vyhledávání dat na platformě Mendeley Data a výsledky hledání s možnostmi filtrace (zdroj: [3], vlastní úprava)

Platforma Mendeley Data také umožňuje pokročilé vyhledávání (Advanced search) pomocí syntaxe určené pro různé pokročilé vyhledávání dat, jako je vyhledávání v definovaných polích a použití booleovských operátorů.

K zacílení na jedno nebo více konkrétních polí v datasetu lze využít následující syntax zadáním tzv. kódu pole (z anglického field code, který musí být psán velkými písmeny) a následným zapsáním požadovaného výrazu do závorky. Přehled jednotlivých kódů polí s jejich popisem je následující: [2]

  • AUTHOR() – vyhledá autory, jejichž jména obsahují výraz zadaný v závorce v jakékoli části jejich jména
  • AUTHOR_ID – podporuje následující ID: Mendeley User ID, Scopus User ID, ORCID a všechna ID uživatelů podporovaná DataCite
  • TITLE() – vyhledá nadpisy, které obsahují výraz zadaný v závorce v jakékoli části textu nadpisu
  • INSTITUTION() – vyhledá instituce, které obsahují výraz zadaný v závorce v jakékoli části textu nadpisu
  • INSTITUTION_ID() – podporuje následující ID: Scopus Institution ID, Scival Institution ID, Mendeley Institution ID
  • ID() – vyhledá dokument, který má externí identifikátor obsahující textový řetězec zadaný v závorce
  • DOI() – vyhledá dokument, který má DOI identifikátor obsahující textový řetězec zadaný v závorce
  • KEYWORDS – filtrování výsledku hledání podle klíčových slov
  • SUBJECT_AREA – filtrování výsledku hledání podle kategorií oblasti předmětu
  • IS_SUPPLEMENT_TO – vyhledá dokument, který je doplňkem k datové sadě se souvisejícím identifikátorem obsahující textový řetězec zadaný v závorce

Pokročilé vyhledávání navíc podporuje booleovské operátory. Data lze vyhledávat pomocí operátorů AND, OR nebo NOT. Kódy polí lze také použít v jakémkoliv booleovském dotazu, který zahrnuje OR mezi kódy polí a normálními dotazy. Příkladem takového dotazu je např.:

  • (competitive intelligence AND AUTHOR(Smith)) OR AUTHOR(Smith AND Johnson) AND INSTITUTION(University of Manchester)

K určení přesné shody textu ve vyhledávání lze použít dvojité uvozovky, a to uvnitř kódu pole i mimo něj. Všechna slova uvnitř uvozovek jsou pak vyhledávána tak, jak jsou zapsána. Alternativně lze použít složené závorky k určení přesné shody textu, ale jsou přijaty pouze jako modifikátor kódu pole a nejsou přijaty ve volném textovém vyhledávání, protože složené závorky nejsou přijímány jako znak ve volném vyhledávání. Příkladem jsou např. tyto dotazy: [2]

  • AUTHOR(„John Smith“) OR AUTHOR({Mary Williams})
  • „competitive intelligence“

Ukázka výsledku pokročilého hledání vypadá následovně (viz obrázek 3) s využitím tohoto dotazu filtrovaného dle typu zdroje na tabulární data:

  • TITLE(„covid-19“ OR coronavirus)
Obrázek 3 – výsledek pokročilého hledání a ukázka výstupu ve formátu xlsx (zdroj: [3], vlastní úprava)

Závěr

Obrovské množství času a finančních prostředků je investováno do sběru nebo generování dat pro konkrétní výzkumnou práci. Ve světě založeném na datech je pak důležitost náležité péče, zpracování a správy výzkumných dat považována za etickou povinnost institucí i vědeckých pracovníků, protože data jsou zásadním přínosem výzkumu.

Mendely Data je otevřený informační zdroj nabízející desítky miliónů vyhledatelných datasetů, které mohou vědečtí pracovníci či akademické instituce volně použít ke generování nových zjištění. Zároveň díky pokročilému vyhledávání a využití vhodné syntaxe je možné zacílit a omezit výsledek vyhledávání na menší množinu relevantních datasetů a ušetřit tak velké množství času. Mendeley Data navíc poskytuje prostor pro správu a uchování výzkumných dat, které po nahrání obdrží DOI, takže na ně lze odkazovat a citovat.

Mendeley Data má však jednu nevýhodu po stránce filtrování výsledků hledání. Filtrování umožňuje vybírat pouze ze tří hlavních skupin, a to dle datového typu, typu repozitáře a zdroje. Není zde však možnost filtrovat dle kalendářních dat. Tuto možnost nenabízí ani pokročilé vyhledávání.

Použité zdroje

[1]       Welcome to DataCite [online]. [vid. 2021-01-31]. Dostupné z: https://datacite.org/

[2]       Frequently Asked Questions – Mendeley Data [online]. [vid. 2021-02-01]. Dostupné z: https://data.mendeley.com/faq

[3]       Mendeley Data [online]. [vid. 2021-02-10]. Dostupné z: https://data.mendeley.com/

WorldWideScience.org – desítky odborných zdrojov na jednom mieste

0

WorldWideScience poskytuje rýchly prehľad obrovského množstva zdrojov z vedeckých databáz. Pozrite sa ako ho využiť.

Internet je dnes pre mnohých ľudí hlavným zdrojom informácií pre osobné ale aj profesné potreby. Prvým nástrojom po ktorom intuitívne siahame (alebo sa nám priamo nanucuje) je niektorý z vyhľadávačov ako napr. Google, Yandex či Baidu – nástroje, ktoré prehľadávajú povrchový web (Hitson a Johnson, 2008). Hoci tieto nástroje poskytujú mnohokrát cenné informácie, pri hľadaní spoľahlivých a aktuálnych vedeckých informácií sa môžu ukázať ako nedostačujúce. Či už pre tendenčnosť, nedostatočnú overiteľnosť, alebo nedostupnosť zdrojových súborov (mnohé stránky blokujú indexovacie roboty).

Odpoveď na vyššie zmienené problémy ponúkajú databázy vedeckých publikácií, ktoré obsahujú recenzované zdroje dostupné podľa presného indexu. Dôraz na recenzovanie a indexáciu však spomaľuje proces pridávania zdrojov (Gusenbauer, 2019).

Hybridnou možnosťou medzi dvomi vyššie zmienenými prístupmi je WorldWideScience (WWS) a Google Scholar. Tie sa snažia o dostupnosť všetkých vedeckých publikácií na jednom mieste (podobne ako vyhľadávače). Publikácie však nie sú jednoznačne indexované a pri zadaní rovnakého dotazu poskytujú rôzne výsledky (Gusenbauer, 2019).

V ďalšom texte sa bližšie oboznámime s WorldWideScience.org

WorldWideScience.org

WWS vzniklo v roku 2008 ako snaha o globálny portál pre prístup k vedeckým zdrojom. Zastrešuje ho WorldWideScience Aliance. Technologicky nadväzuje na Science.gov – využíva rovnaký federatívny vyhľadávací model (Hitson a Johnson, 2008). Obsahuje články zo 110 databáz, vrátane troch českých (Repozitář Akademie Věd ČR, Knihovna Akademie Věd ČR, Národní úložiště šedé literatury). Zdrojové databázy môžeme zobraziť na úvodnej stránke, kliknutím na mapu štátu, alebo tlačidlo
view participants as list“ (WorldWideScience.org, 2020).

Mapa členských krajín. Zdroj: https://worldwidescience.org/

Rešeršné možnosti

WWS ponúka dva spôsoby prehľadávania databázy:

Jednoduché vyhľadávanie – cez pole vyhľadávania na úvodnej stránke

Jednoduché vyhľadávanie. Zdroj: https://worldwidescience.org/

Podrobné vyhľadávanie – dostupné v sekcii „Advanced Search“

Pokročilé vyhľadávanie. Zdroj: https://worldwidescience.org/

Podrobné vyhľadávanie ponúka možnosť vyhľadávať frázy podľa obsahu dokumentu, podľa názvu, autora, roku a jazyka  . Zároveň ponúka možnosť vybrať konkrétne databázy, ktoré majú byť prehľadávané.

Zaujímavou je tiež funkcia prekladač. Po zadaní dotazu sú databázy postupne prehľadávané. Pri každej databáze sa dotaz preloží do jej jazyka. Následne je databáza prehľadaná a výsledky sú postupne zobrazované v pôvodnom jazyku.

Výsledky sú zobrazované priebežne ešte pred dokončením vyhľadávania (WorldWideScience.org, 2020).

Syntax a operátory

WWS ponúka možnosť pokročilého vyhľadávania pomocou špeciálnych operátorov. Vo vyhľadávaní nerozlišuje veľké a malé písmená.

Pre vyhľadávanie presnej frázy rovnako ako pri väčšine vyhľadávačov uzavrieme výraz do dvojitých úvodzoviek (napr. “competitor intelligence“).

Pri vyhľadávaní viacerých výrazov je možné využiť operátory:

  • AND – vráti výsledky pre obsahujúce oba výrazy spojené týmto operátorom. Rovnako sú interpretované výrazy oddelené medzerou (napr. výraz competitor intelligence vráti rovnaké výsledky ako competitor AND intelligence).
  • OR – vráti výsledky obsahujúce aspoň jeden z výrazov spojených týmto operátorom.
  • NOT – vráti výsledky ktoré neobsahujú výraz nasledujúci za týmto operátorom.

Výrazy je možné logicky usporiadať pomocou zátvoriek (napr. (competitor OR competitive) AND intelligence vráti zároveň výsledky pre competitive intelligence aj competitor intelligence).

Ak chceme vyhľadať všetky slová, ktoré majú rovnaký koreň, môžeme využiť tzv. zástupné znaky. Tie môžu byť využité na začiatku, na konci, alebo uprostred výrazu.

  • Otáznik (?) zastupuje práve jeden ľubovoľný znak (napr. ??tra vráti výsledky pre extra, intra, ultra apod.)
  • Hviezdička (*) zastupuje ľubovoľný počet znakov od nuly do nekonečna (napr. competit* vráti výsledky pre competit, copmetitor, competitive, competition apod.) (org, 2020)

Výsledky

Výsledky sú po vyhodnotení dotazu, podobne ako vo vyhľadávačoch povrchového webu ohodnotené a usporiadané podľa relevancie. Relevancia výsledkov je hodnotená 1-5 hviezdičkami. Vďaka tomu sa nám na prvých miestach zobrazujú najrelevantnejšie výsledky.

Zároveň je však nutné podotknúť, že vyhľadávanie rovnakého výrazu nevráti vždy rovnaké výsledky. Napr. po zadaní dotazu intelligence sme pri prvom zadaní dosiahli vo výsledku 5466 článkov a pri opätovnom zadaní rovnakého dotazu bol výsledok už len 5414 článkov (viď obrázky nižšie). Celkovo tak možno predpokladať skôr strojovú, nie úplne exaktnú indexáciu.

Výsledky prvého dotazu. Zdroj: https://worldwidescience.org/
Výsledky druhého dotazu. Zdroj: https://worldwidescience.org/

Okno s výsledkami je rozdelené do 3 stĺpcov: súhrnné informácie a filtre (vľavo), zoznam výsledkov (uprostred), odkazy na wikipédiu a EurekAlert (vpravo).

V ľavej časti je výsledky možné filtrovať podľa:

  • Dátumu
  • Času
  • Autora
  • Názvu publikácie
  • Krajiny
  • Jazyka
  • Typu dokumentu (článok, kniha, patent…)
  • Zdrojovej databázy
  • Formátu (Full Text, HTML, PDF…).
Filtrovanie výsledkov vyhľadávania. Zdroj: https://worldwidescience.org/

V záložke Visual zasa môžeme vidieť zaradenie do kategórií podľa témy. Kliknutím na názov témy môžeme zúžiť zoznam výsledkov na tie, ktoré zodpovedajú príslušnej téme.

Výsledky vyhľadávania podľa témy. Zdroj: https://worldwidescience.org/

V strednom paneli sú výsledky rozdelené do štyroch kategórií: články, multimediálne záznamy, dátové súbory/software a voľne prístupné zdroje, čo značne zjednodušuje prehľadávanie veľkého počtu výsledkov.

Vo výsledkoch vyhľadávania je sa zobrazuje:

  • názov dokumentu s priamym odkazom na dokument
  • relevancia (1 až 5 hviezdičiek) a formát dokumentu
  • názov a priamy odkaz na zdrojovú databázu
  • mená autorov
  • dátum publikácie
  • abstrakt

(WorldWideScience.org, 2020)

Ukážka výsledku vyhľadávania. Zdroj: https://worldwidescience.org/

Výsledky je ďalej možné preložiť do anglického jazyka, uložiť do svojej knižnice a exportovať (vo formáte RIS, alebo do programov Mendeley, Zotero, RefWorks a EndNote), vytlačiť, alebo odoslať do emailovej schránky.

Možnosti práce s výsledkami vyhľadávania. Zdroj: https://worldwidescience.org/

Zhrnutie

WorldWideScience poskytuje široké možnosti prehľadávania odborných databáz. Jej najväčšou výhodou oproti bežným databázam je rozsah zdrojov, ktoré možno prehľadávať a rýchlosť prehľadávania. Na druhej strane však nie je možné jednoznačne popísať spôsob indexácie ani dosahovať jednoznačné výsledky. Tieto vlastnosti ju robia veľmi podobnou vyhľadávaču GoogleScholar, na rozdiel od neho však ponúka lepšie možnosti celkovej analýzy výsledkov a práce s nimi.

Zoznam zdrojov

  1. Gusenbauer, M. (2019) “Google Scholar to overshadow them all? Comparing the sizes of 12 academic search engines and bibliographic databases”, Scientometrics, 118(1), s. 177–214. doi: 10.1007/s11192-018-2958-5.
  2. Hitson, B. A. a Johnson, L. A. (2008) “WorldWideScience.org Bringing Light to Grey”, v Farace, DJ (ed.) DESIGNING THE GREY GRID FOR INFORMATION SOCIETY. GL PROGRAM \& CONFERENCE BUREAU, JAVASTRAAT 194-HS, AMSTERDAM, 1095 CP, NETHERLANDS: TEXTRELEASE (GL Conference Series), s. 11–20.
  3. org (2020). Available at: https://worldwidescience.org/ (Cit: 01. február 2021).

 

ClinicalTrials.gov – Klinické štúdie z celého sveta

0

ClinicalTrials.gov je webová stránka obsahujúca databázu o prevedených a plánovaných klinických štúdiách vo svete. Databáza zahrnuje štúdie celú škálu štúdií o rôznych chorobách, liekov a defektov. Je určená jak pre širokú verejnosť, tak pre odborníkov z praxe. Patrí pod správu National Library of Medicine (NLM), ktorá patrí pod National Institutes of Health (NIH). [1]

Americkým kongresom bola schválená v roku 1997, a to ako následok viacerých obvinení, že spoločnosti úmyselne tajili vedľajšie efekty svojich liekov za účelom zisku. [2] Verejne dostupnou sa stránka stala vo februári roku 2000 a v čase písania článku, obsahuje informácie o 365 tisíc štúdiách z 219 štátov sveta.

Klinické štúdium je pojem, ktorý označuje výskum na dobrovoľníkoch a má za cieľ rozšíriť znalosti medicíny. Sú vykonávané za účelom potvrdenia bezpečnosti a efektivity novej liečby. Na to, aby bol liek schválený pre štandardné užitie (predpisovanie lekárom), musí byť najprv vyhodnotený v rámci klinickej štúdie. Pacienti v týchto štúdiách patria medzi tých, ktorí prijímajú novú liečbu predtým než je dostupná verejnosti. Je v nich podávaný liek, u ktorého sa môžu vyskytnúť vedľajšie účinky ktoré už sú známe  laboratórnych testov , alebo sa môžu vyskytnúť nové nežiadúce vedľajšie účinky. Preto sú účastníci týchto štúdií pozorovaní a kontrolovaní prísnejšie, než je štandard. [3]

Možnosti vyhľadávania

Stránka poskytuje celkovo štyri možnosti vyhľadávania, ktoré nás dostanú na zoznam štúdií podľa našich kritérií – „New Search“, „Advanced Search“, „See Studies by Topic“ a „See Studies on Map“.

See Studies by Topic nám stromovou štruktúrou umožní prejsť na nami hľadanú chorobu. Tento spôsob je vhodný, pokiaľ máme predstavu čoho sa choroba týka, no nevieme si spomenúť na presný názov toho, čo hľadáme.

Obrázok 1 – See Studies by Topic [zdroj: ClinicalTrials.gov]

See Studies on Map nám zobrazí interaktívnu mapu, pomocou ktorej sa preklikáme na územie prevedenej štúdie, následne sa nám zobrazí zoznam štúdií, do ktorej sa zapojili inštitúcie z daných štátov. Je potrebné myslieť na to, že do niektorých štúdií sa zapojili desiatky až stovky štátov, preto sa nám zobrazia aj štúdie, kde je krajina reprezentovaná napríklad len jednou inštitúciou z mnohých.

Obrázok 2 – See Studies on Map [zdroj: ClinicalTrials.gov]

Hľadanie podľa kategórií a podľa krajiny sú značne obmedzené na len jeden filter, podľa ktorého štúdie hľadáme. Aj keď sa zobrazené záznamy dajú následne filtrovať v ďalších krokoch, tak pre konkrétnejšie hľadanie je výrazne pohodlnejšie a praktickejšie rovno použiť voľby Search a Advanced Search.

New Search / Advanced Search

Táto voľba reprezentuje klasickejší pojem vyhľadávania, kde si ako užívateľ zvolíme kľúčové slová a podmienky, ktoré chceme aby štúdia obsahovala.

V základnom hľadaní je možné štúdie filtrovať podľa názvu choroby, ostatných spojených pojmov (identifikátor štúdie, použité lieky,…), krajiny alebo dokonca aj konkrétneho mesta. Všetky tieto polia sú nepovinné, čo umožňuje obrovskú flexibilitu hľadania.

Obrázok 3 – Základné vyhľadávanie [zdroj:ClinicalTrials.gov]

Advanced search umožňuje okrem týchto faktorov hľadať podľa rady ďalších ako sú vek a pohlavie participantov, či štúdia zverejnila svoje výsledky, sponzor, štádium a dátumy relevantné s danou štúdiou.

Pri vyhľadávaní hľadá dotaz každé slovo jak spolu tak zvlášť. Ak do contidion or disease zadáme – heart attack, tak dostaneme jak výsledky obsahujúce pojem spolu tak výsledky, u ktorých sú slová oddelené : Heart Defects and Transient Ischemic Attacks. [1]

Pokiaľ chceme hľadať tento výraz ako celok, môžeme dať celý výraz do “ „. Či už při použití horných úvodzoviek alebo nie, nájdené a zvýraznené sú taktiež medicínske synonymá daného pojmu. V tomto príklade by nám vyskočili aj výsledky, ktoré priamo neobsahujú heart attack ale obsahujú spojenie myocardial infarction.

Hľadanie taktiež podporuje používanie booleovských operátorov OR, NOT a AND pre pokročilejšie kombinované vyhľadávanie. Pre použitie viacero operátorov v jednom výraze je potrebné použiť guľaté zátvorky –

(heart disease OR heart attack) AND (stroke OR clot)

Výsledok hľadania Condition or disease  – Covid19 AND Asthma

Obrázok 4 – Výsledok vyhľadávania Covid19 OR Asthma [zdroj: ClinicalTrials.gov]

Všetky hľadané nájdené slová sú v zobrazených záznamoch zázname zvýraznené.

Pre zobrazenie hľadaných synoným a upravenie vyhľadávania môžeme použiť záložku „Search Details“, ktorá nám zobrazí vyhľadávané slová, a umožní upraviť náš dotaz.

Obrázok 5 – Search Details Covid19 AND Asthma [zdroj: ClinicalTrials.gov]

 

Popis štúdie

Informácie o klinickej štúdií si môžeme zobraziť kliknutím na vybranú štúdiu.

Každý záznam (jednotlivé klinické štúdium) obsahuje nasledovné:

  • Skúmaná choroba
  • Skúmaný jav (liek, prostredie, chovanie, ktoré je skúmané)
  • Názov, popis a dizajn
  • Kritéria pre účastníkov štúdie
  • Lokácie zapojených inštitúcií
  • Kontaktné informácie na inštitúcie
  • Odkazy na informácie z ostatných použitých zdrojov

Niektoré záznamy môžu obsahovať naviac:

  • popis účastníkov (demografia, vek pohlavie, odhadovaný a reálny počet)
  • výsledky
  • súhrn nežiadúcich udalostí účastníkov štúdie

Tieto informácie si môžeme pozrieť buď v móde textovom alebo vo forme tabuľky.

Obrázok 6 – Detail záznamu [zdroj: ClinicalTrials.gov]

 

Výsledky

U niektorých štúdií sa miesto Study Results nachádza „No Study Results Posted“, čo znamená že výsledky pre danú štúdiu neboli verejne publikované. Pokiaľ nás zaujímajú len štúdie s dostupnými výsledkami, je potreba nastaviť filter „Study Results“ tak, že zaznačíme „With Results“. Len completed výsledky nám nestačia z dôvodu, že nie všetky výsledky sú verejne dostupné. Buď to nie je v ich legislatíve povinné, buď legislatívu porušujú a výsledky zverejňujú neskoro až vôbec [3], alebo čakajú na schválenie. Keď niektorá štúdia chce uverejniť svoje výsledky, tak musia prejsť cez takzvanú Quality control (QC) od NLM. V tejto kontrole sú identifikované chyby, nedostatky alebo nezrovnalosti a výsledky s komentárom vrátené žiadateľovi o zverejnenie na opravenie.

Správne zverejnený výsledok obsahuje sekcie

  • Tok účastníkov
  • Základné charakteristiky
  • Štatistická analýza
  • Nežiadúce účinky
  • Obmedzenia a výhrady
  • Administratívne informácie

 

Využitie

ClinicalTrials má za úlohu udržovať informácie o klinických štúdiách verejne dostupné a tým predchádzať podvodom a zatajovaniu vedľajších účinkov liekov a poškodzovania pacientov užívajúcich ich.

Na individuálnej úrovni zverejnené výsledky umožňujú lekárom previesť vlastný výskum na lieky, ktoré predpisujú. Vďaka tomu, že obsahuje záznamy aj o plánovaných štúdiách, podporuje informovanosť, a zjednodušuje zapojenie sa do nich.

Motivácia pre účasť v štúdii môže byť rôzna. Pri testovaní na zdravých dobrovoľníkov môže byť účasť kompenzovaná finančnou odmenou. Pre ľudí s ťažkými chorobami to môže byť cesta ako sa rýchlejšie dostať k viac účinnejšej a pohodlnejšej forme liečby. Pre nemocnice a lekárov je to možnosť, ako bezplatne získať nový liek (lieky v štúdií poskytuje zadávateľ), a taktiež sa zoznámiť s novým spôsobom liečby danej choroby. [4]

Pre otestovanie využiteľnosti ClinicalTrials v Českej republike bol vymyslený fiktívny človek, muž, 22 rokov, žijúci v Prahe, ochotný dochádzať maximálne 100 míľ, ktorý trpí Crohnovou chorobou a má záujem dozvedieť sa informácie o metódach liečby. Verí len výskumom, v ktorých boli zapojené pražské inštitúcie.

Pri zadaní daných informácií do vyhľadávania a zvolení si len dokončených štúdie s výsledkami dostaneme a 23 záznamov.

Predpokladajme, že niektorá látka nás zaujala a chceme zistiť možnosti zapojiť sa do plánovanej štúdie v okolí. Filter obmedzíme len na „Recruiting“, dostaneme taktiež 23 výsledkov. V týchto výsledkoch nájdeme rovno 15 rôznych liekov plánované na klinické štúdie v Prahe, ktoré práve naberajú dobrovoľníkov:

E6011, Risankizumab, Ustekinumab, PF-06651600, PF-06700841, Etrolizumab, Guselkumab, Filgotinib, Upadacitinib, Mirikizumab, Cx601, BMS-986165, Ozanimod, UTTR1147A,  Adalimumab

 

 

 

Použíté zdroje

[1] U.S. National Library of Medicine, ClinicalTrials.gov [online] [cit 31.1.2021] Dostupné z: https://clinicaltrials.gov/ct2/help/

[2]  PILLER, Charles. FDA and NIH let clinical trial sponsors keep results secret and break the law. 2020  [online] [cit 1.2.2021] Dostupné z: https://www.sciencemag.org/news/2020/01/fda-and-nih-let-clinical-trial-sponsors-keep-results-secret-and-break-law

[3] Masarykův onkologický ústav, Co jsou to klinické studie?. [online] [cit 1.2.2021] Dostupné z: https://www.mou.cz/co-jsou-to-klinicke-studie/t900

[4]  Státní ústav pro kontrolu léčiv, Jak jsou motivováni dobrovolníci, pacienti, lékaři, zdravotnická zařízení, aby se zařadili do klinické studie?. [online] [cit 1.2.2021] Dostupné z: https://www.sukl.cz/leciva/jak-jsou-motivovani-dobrovolnici-pacienti-lekari

 

Obrázok 1 – See Studies by Topic [zdroj: ClinicalTrials.gov].

Obrázok 2 – See Studies on Map [zdroj: ClinicalTrials.gov].

Obrázok 3 – Základné vyhľadávanie [zdroj: autor].

Obrázok 4 – Výsledok vyhľadávania Covid19 OR Asthma [zdroj: ClinicalTrials.gov].

Obrázok 5 – Search Details Covid19 AND Asthma [zdroj: ClinicalTrials.gov].

Obrázok 6 – Detail záznamu [zdroj: ClinicalTrials.gov].

 

DATA.GOV: Otevřená data poskytovaná vládou USA

0
[zdroj obrázku: pixabay.com]
[zdroj obrázku: pixabay.com]

Úvod

Portál data.gov, pomocí kterého vláda USA poskytuje otevřená data veřejnosti vznikl v roce 2009. Založila ho a spravuje ho vládní agentura General Service Administration, sídlící ve Washington D.C.. Projekt je postavený na open source tenchologiích CKAN a WordPress a celý jeho vývoj je veřejně přístupný na platformě GitHub. [1] Celý projekt vznikl pod vedením Viveka Kundry, který byl do pozice jmenován prezidentem Barackem Obamou. [2] Vivek Kundra se kromě poskytování veřejných datasetů zasadil také o vytvoření portálu recovery.gov, kde vláda transparentně poskytovala informace o finančních tocích v rámci stimulačního balíčku ARRA (American Recovery and Reinvestment Act of 2009). [3] K datu 7. 2. 2021 je počet datasetů na portále data.gov 192 180. [1]

V rámci otevření dat veřejnosti byl tedy v roce 2009 zřízen server data.gov, který funguje pro shromažďování a vyhledávání dat, poskytovaných vládou USA. Na tomto portále by měla být všechna data, která vláda generuje a které zároveň nejsou soukromá nebo nemohou být veřejná z bezpečnostních důvodů. Celý projekt je postavený na součinnosti vlády a jednotlivců. Podle tvůrce tohoto portálu, Viveka Kundry projekt „měl zajistit, že se vláda dokáže vypořádat s novou realitou.” [2] Celá myšlenka otevřených dat poskytovaných státními orgány je postavena na tom, že lidé, kteří budou mít k dispozici všechna tato data, se mohou podílet na připomínkování vládních akcí, samotné kontrole nebo mohou pomocí dat nabídnout i lepší řešení. Taková občanská aktivita je pomocí portálu data.gov dokonce i finančně odměňována. Jak konkrétně, je uvedeno pod záložkou Challenges u jednotlivých témat dat portálu data.gov (např. https://www.data.gov/energy/energy-challenges u energií).

Rešeršní možnosti

První a základní možností, jak hledat datasety na portálu data.gov, je klasický search box, který se nachází buď defaultně v pravém horním horu obrazovky nebo po otevření data catalogu (kliknutí na záložku DATA) uprostřed stránky. Tento search box slouží ke klasickému vyhledávání datasetů a pro jednotlivé vyhledávací příkazy není k dispozici žádný speciální syntax.

Pro upřesnění vyhledávané fráze slouží několik nástrojů. Prvním z nich jsou témata obsahů datasetů. Po otevření nabídky TOPICS dostaneme na výběr 7 témat, konkrétně: Agriculture, Climate, Energy, Local Government, Maritime, Ocean a Older Adults Health. Po otevření jednotlivých témat se objeví vždy trochu odlišné prostředí. Vždy se zobrazí nová lišta se záložkami, ale každé téma má odlišné složení těchto záložek, proto je jejich souhrn zobrazen na obrázku 1.

Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]
Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]

Některá témata mají záložku Updates, která funguje jako úvodní stránka pro dané téma. Na záložce Data se otevře příslušný Data catalog, filtrovaný pouze na dané téma. Pod záložkou Apps se nacházejí existující aplikace, které byly vytvořeny uživateli na daných otevřených datech tohoto tématu. Jak již bylo zmíněno, Challenges jsou pobídky uživatelům vyřešit konkrétní problémy daného odvětví pomocí otevřených dat poskytovaných tímto portálem, za finanční odměnu. Dále jsou záložky pro přidání nových dat, frekventované dotazy, zdroje dat a kontaktní údaje na příslušné oddělení. Pro téma Older Adults Health se tato lišta nezobrazí vůbec a uživatel je přesunut přímo na příslušnou část Data catalogu.

Druhou možností, jak zúžit počet vyhledaných datasetů je přes filtry, umístěné na levé straně prostředí Data catalogu. Jejich seznam s krátkým popisem je uveden níže:

  • Topics – témata obsahu datasetů
  • Dataset Type – zda je dataset geoprostorový
  • Tags – tagy datasetů
  • Formats – formáty datasetů
  • Organization Types – typ organizace, která nahrála dataset
  • Organization – název organizace, která nahrála dataset
  • Publishers – název vydavatele datasetu
  • Bureaus – příslušný úřad, jehož se dataset týká

Třetí možností, jak omezit vyhledané datasety, je použití mapy, která je první položkou mezi filtry. Na této mapě můžeme po kliknutí na ikonu tužky vravo nahoře vymezit obdélníkovým tvarem území. Po vymezení území se nám najdou pouze datasety, které se týkají tohoto vymezeného území.

Poté, co spustíme vyhledávání, na pravé části prostředí Data catalogu se nám zobrazí počet vyhledaných datasetů a pod ním výsledky vyhledávání čili jednotlivé vyhledané datasety. U takto vyhledaných datasetů je zobrazen název datasetu, pod ním název jeho vydavatele a jeho krátký popis. Pod popisem jsou barevně zobrazeny formáty, ve kterých můžeme dataset získat a vpravo je graficky znázorněno, jakého typu územního celku země se dataset týká (Federal, State, City …). Příklad výsledků vyhledání slovního spojení „police victim“ je znázorněn na Obrázku 2.

Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]
Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]

Výsledky vyhledávání má uživatel možnost seřadit podle Relevance, Názvu vzestupně, Názvu sestupně, Data úpravy, Popularity a Data přidání. Sestupnost nebo vzestupnost seřazení lze volit jen u názvu, data lze seřadit pouze od nejnovějšího.

Po kliknutí na konkrétní dataset se zobrazí jeho stránka. Vše bude názorně ukázáno na příkladu datasetu Allegheny County 911 Dispatches – EMS and Fire. Na stránce datasetu je na levé straně název organizace, pod kterou dataset spadá, její krátký popis a v pravém horním rohu graficky znázorněn typ územního celku, viz Obrázek 3.

Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: data.gov]
Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: data.gov]

Pod informacemi o organizaci je dále téma obsahu datasetu, vydavatel a jeho kontakt, možnost sdílení a odkaz na podmínky použití. V pravé, hlavní, části této stránky je případné upozornění ohledně podmínek užití datasetu, dále název a pod ním datum poslední úpravy metadat. Následuje podrobný popis datasetu. Poté jsou zobrazeny informace o dostupnosti a použití, viz Obrázek 4.

Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]
Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]

Dále se zobrazí všechny soubory dostupné ke stažení, u kterých je ikona znázorňující formát, název, krátký popis a tlačítko Download pro stažení. Pod soubory jsou data vytvoření a upravení metadat, zdroj metadat, tagy související s datasetem a doplňující metadata tohoto datasetu.

Příklady použití

Portál data.gov zobrazuje seznam aplikací poskytovaných otevřených dat na stránce https://www.data.gov/applications.  Zde můžeme najít, jaké projekty byly vytvořeny na základě otevřených dat, které poskytuje vláda USA. Pro představu je to například mobilní aplikace AIRnow, která poskytuje informace v reálném čase o čistotě ovzduší. Slouží jak pro aktuální informace, tak i pro předpověď. [4]

Dalším příkladem je portál Alternative Fueling Station Locator. Tato webová aplikace poskytuje geoprostorové informace o lokacích čerpácích a nabíjecích stanic s alternativními palivy na území USA a Kanady. Na mapě si uživatel může najít stanice pro čerpání bio nafty, CNG, elektrické energie, ethanolu, vodíku, LNG a propanu. [5] Celý projekt je postavený na mapách OpenStreetMap, což je skvělá ukázka toho, jak otevřená data a open-source projekty mohou reálně pomáhat.

Data portálu data.gov jsou využity i pro mobilní aplikaci LeafSnap, která pomáhá uživatelům poznávat rostliny. Pomocí aplikace stačí neznámou rostlinu vyfotit a aplikace za pomoci algoritmů pro rozpoznávání obrázků dokáže rostlinám na fotografii přiřadit jejich název. [6]

Závěr

Portál data.gov byl vytvořen za účelem zapojení občanů do veřejného dění, pro lepší transparentnost veřejné správy a její možnou kontrolu. Je to databáze informací ze všech různých oblastí, ve kterých určitým způsobem figuruje vláda USA, která tato data zpracovává, generuje a všechna data, která neporušují soukromí nebo nenarušují bezpečnost, poskytuje veřejnosti. Jelikož jsou tato data otevřená mohou se uplatnit za pomoci kohokoli na světě a zároveň je dbáno na to, aby to byla data ve formě, ve které nemohou být zneužita. Díky příkladům aplikací, které jsou přímo na stránkách data.gov uvedeny, lze potvrdit, že účel, který tento portál má, je alespoň částečně naplňován.

Zdroje

[1] ANON., nedatováno. About Data.gov. Data.gov [online] [vid. 2021-02-07]. Dostupné z: https://www.data.gov/about/

[2] HANSELL, Saul, 2009. The Nation’s New Chief Information Officer Speaks. Bits Blog [online]. [vid. 2021-02-07]. Dostupné z: https://bits.blogs.nytimes.com/2009/03/05/the-nations-new-chief-information-officer-speaks/

[3] ANON., nedatováno. Recovery.gov | U.S. Department of Education [online] [vid. 2021-02-07]. Dostupné z: https://www.ed.gov/open/plan/recovery-gov

[4] ADMIN |, nedatováno. AIRNOW WIDGET – Developer Central [online]. [vid. 2021-02-07]. Dostupné z: https://developer.epa.gov/airnow-widget/

[5] ANON., nedatováno. Alternative Fuels Data Center: Alternative Fueling Station Locator [online] [vid. 2021-02-07]. Dostupné z: https://afdc.energy.gov/stations/#/find/nearest

[6] ANON., nedatováno. LeafSnap – Plant Identification [online] [vid. 2021-02-07]. Dostupné z: https://plantidentifier.info/

Seznam obrázků

Obrázek 1: Složení záložek u jednotlivých témat na portále data.gov. [zdroj obrázku: data.gov]

Obrázek 2: Výsledky vyhledávání na portále data.gov. [zdroj obrázku: data.gov]

Obrázek 3: Profil organizace na stránce datasetu. [zdroj obrázku: dat.gov]

Obrázek 4: Informace o dostupnosti a použití na stránce datasetu. [zdroj obrázku: data.gov]