Domů Blog

Census.gov: co prozrazují o Američanech data

0

Úvod

Sčítání lidu v USA je řízeno pod záštitou organizace United States Census Bureau (UCSB), v češtině tzv. Americký úřad pro sčítání lidu. Ten poskytuje údaje o lidech a ekonomice národa. Každých 10 let provádí sčítání lidu, domů a bytů, do kterého se počítají všichni obyvatelé Spojených států. Agentura také shromažďuje údaje prostřednictvím více než 100 dalších průzkumů u domácností a podniků každých jeden až pět let.

Četné sčítání a průzkumy každý rok pomáhají jednotlivým státům, místním komunitám a podnikům rozdělit více než 675 miliard dolarů ve federálních fondech a zároveň pomáhají státům, místním komunitám a podnikům při přijímání informovaných rozhodnutí. Podniky používají údaje ze sčítání k určení, kde by měly být postaveny sklady, kanceláře a obchody, což vede k vytváření pracovních míst. Developeři k výstavbě nových domů a revitalizaci stávajících. Sčítání používají místní samosprávy k veřejné bezpečnosti a připravenosti na mimořádné události. Obyvatelé používají sčítání k prosazování politiky, kvality života a programů prosazování práv spotřebitelů ve svých komunitách.

První sčítání proběhlo více než rok po inauguraci prezidenta George Washingtona a těsně před skončením druhého zasedání prvního kongresu. Za sčítání lidu z roku 1790 dostali od kongresu odpovědnost jednotliví maršálové. Pohlaví, barva, vztah k osobě v čele domácnosti, jméno osoby v čele domácnosti a případně počet otroků, to vše bylo součástí šesti šetření v roce 1790. Maršálové některých států šli nad rámec těchto dotazů a shromažďovali informace o zaměstnání a počtu bytů ve městě.

Typologie datasetů

Řada základních statistik podnikání (Core Business Statistics)

V pěti tabulkách dat, které jsou zveřejněny na data.census.gov počínaje zářím 2019, nabízí řada Core Business Statistics řadu statistik o počtu provozoven, pracovních míst, mezd a hodnotě tržeb, příjmů, příjmů nebo zásilek pro provozovny společností s platícími pracovníky pro jednotlivá odvětví na úrovni USA nebo státu.

Statistiky dle geografie (Geographic Area Series)

Série geografických oblastí obsahuje komplexní odvětvové statistiky pro podniky s platícími pracovníky podle zeměpisných oblastí. Informace jsou založeny na severoamerickém průmyslovém klasifikačním systému (NAICS) pro rok 2017.

Shrnující statistiky (Subject & Summary Series)

Tyto statistiky obsahují souhrnná data dle odvětví a dalších specifických témat. Tyto údaje víceméně shrnují informace, které jsou zveřejněny v datových řadách pro podnikání či pro jednotlivá geografické oblasti. Obsah těchto sérií je nadále seskupen dle tematických sestav, které např. zahrnují: produktové řady, provozny a jejich velikosti, lokaci výrobních závodů apod. Data pro tato témata jsou primárně k dispozici na úrovni USA a u vybraných témat na úrovni státu.

Kategorizace dat

Velký objem dat, které UCSB sdružuje, jsou děleny dle NAICS struktury a kódů.

NAICS struktura

NAICS struktura je dělena do hierarchického vztahu:

  • Sektor: dvoučíselný kód
    • Subsektor: tříčíselný kód
      • Skupina odvětví: čtyřčíselný kód
        • NAICS odvětví: pětičíselný kód
          • Státní odvětví: šestičíselný kód
Obrázek 1: NAICS hierarchie; zdroj: census.gov

Definice sektorů

V NAICS struktuře je zahrnuto 20 sektorů. Až na sektory 11 a 92 (viz níže) jsou zahrnuty do ekonomického sčítání.

Obrázek 2: NAICS struktura odvětví; zdroj: census.gov

Vládní instituce nejsou do ekonomického sčítání obvykle zahrnuty, i když bude jejich primární provoz klasifikován v průmyslových odvětvích zahrnutých do ekonomického sčítání. Údaje o sčítání lidu z průmyslových odvětví v několika odvětvích se mohou v důsledku těchto výluk zdát neúplné. Zároveň byly z hospodářského sčítání vyloučeny některé oficiální operace:

  • Nemocnice
  • Vládní obchody s lihovinami
  • Vydavatelé univerzitního tisku
  • Federální rezervní banky

Existuje samostatné sčítání vlád, které poskytuje některé údaje o příjmech, výdajích a zaměstnanosti pro různé vládní funkce, jako jsou ulice a dálnice, nakládání s pevným odpadem, kanalizace, elektrická energie, doprava a místní knihovny.

Hledání dat na census.gov

Hledání dat přes census.gov můžeme rozdělit do dvou perspektiv: uživatelské rozhraní a developerské rozhraní přes API. Z uživatelského pohledu je hledání dat velmi jednoduché. Census.gov nabízí dva primární nástroje: QuickFacts a Census Business Builder.

QuickFacts

QuickFacts je uživatelsky přívětivý rámec, který nabízí tabulky, mapy a grafy běžně požadovaných statistik z různých sčítání lidu, průzkumů a služeb. K dispozici jsou profily pro celou zemi, všech 50 států, District of Columbia a Portoriko, stejně jako všechny kraje. Zahrnuty jsou také města a města s počtem obyvatel 5 000 a více.

Obrázek 3: QuickFacts hledání; zdroj: census.gov/quickfacts

Uživatel si lehce může zvolit lokalitu a v nabídce rychle zvolit i jednotlivé fakta. Po zadání svého požadavku si uživatel může daná data zobrazit graficky na mapě či v jiném grafickém vyjádření. Zajímavostí pro uživatele může být i vytvoření dashboardu či možnosti sdílení dat přes email či sociální sítě (FB, Twitter). Uživatel si samozřejmě může data vytisknout či stáhnout ve formátu CSV.

Census Business Builder

Census Business Builder (CBB) je kolekce služeb Census Bureau, která poskytuje demografické a ekonomické údaje přizpůsobené konkrétním typům uživatelů ve snadno použitelném formátu. Co si pod tím ale představit? Tento nástroj je speciálně mířen na byznys uživatele, který mají za cíl založit podnik a chtějí získat počáteční data pro svoje rozhodování. CBB na základě lokace a odvětví či NAICS kódu uživateli přípraví report, který je dělen do několika částí:

  • Potenciální zákazníci
    • demografická analýza
    • socioekonomická analýza
    • ostatní relevantní analýzy
  • Analýza daného sektoru v dané lokalitě
  • Analýza spotřebitelských výdajů
  • Ostatní (liší se dle uživatelských vstupů při hledání)

Níže jako příklad uvádím část reportu pro tyto zadané vstupy: odvětví – komerční nemovitosti, lokalita – Oklahoma City.

Obrázek 4: CBS report; zdroj: cbb.census.gov

Census Data API

Census Data Application Programming Interface (API) je datová služba, která umožňuje vývojářům softwaru přistupovat a používat data Census Bureau v rámci svých aplikací. Toto API používají výzkumní pracovníci a vývojáři aplikací v rámci Census Bureau i mimo něj. Jeho jednoduchý nezpracovaný formát usnadňuje a zpřístupňuje zadávání dat v jakémkoli formátu, který uživatelé potřebují pro prezentaci a manipulaci s daty. Census Data API je rychlý a snadný způsob dotazování dat přímo ze serverů Census Bureau a přináší řadu výhod:

  • Snadné stahování cílových proměnných a geografických oblastí
  • Připojuje se ke statistickým nástrojům, jako jsou R a SAS
  • Poskytuje okamžitý přístup k nejnovějším datům
  • Usnadňuje vytváření inovativních mobilních a webových aplikací
  • Vytváří vizualizace dat

Census Bureau již zpřístupnilo většinu svých datasetů a přidává na měsíční bázi další. Mezi nejčastěji využívané patří:

  • American Community Surveys (ACS)
  • Časové řady ekonomických ukazatelů
  • Desetileté sčítání lidu
  • Ekonomické sčítání lidu
  • Odhady populace a projekce
  • Mezinárodní obchod

Kompletní list dostupných datasetů lze najít přes tzv. API Discovery Tool.

Obrázek 5: Rozhraní API Discovery Tool; zdroj: api.census.gov

Queries fungují na stejné bázi jako jakékoliv jiné informační zdroje. Census Bureau používá nestandardní verzi JSON, kde data jsou reprezentovány v dvourozměrném poli, hranaté závorky („[]“) obsahují pole a hodnoty jsou odděleny čárkou. Viz příklad níže:

Obrázek 6: API vyhledávání dat; zdroj: Census Data API User Guide

Klíčové pojmy důležité pro práci s API Census Bureau

  • Proměnné
    • Každá jednotka dat, kterou uživatel hledá v datové sadě, se označuje jako proměnná. Každá proměnná v datové sadě má název, který může být sám o sobě zkratkou nebo něčím smysluplným, například STNAME, POP nebo DATE_.
  • Povinné proměnné
    • Povinné proměnné jsou parametry, které uživatel musí zahrnout do vyhledávání; v opačném případě jeho vyhledávání neprodukuje žádná data a vrátí chybovou zprávu.
  • Atributy
    • Další proměnné, které může uživatel použít při volání API k poskytnutí dalších podrobností o primární proměnné, se nazývají atributy. Lze zahrnout například štítky, poznámky, meze chyby, statistickou významnost apod.
  • Get Funkce
    • Funkce get (get =) určuje požadované a vybrané proměnné, které od API žádá uživatel.
  • Predikáty
    • Uživatel může vytvořit predikáty pro geografii, string proměnné, číselné proměnné a čas; a všechny určují, jak by měly být proměnné filtrovány nebo omezovány (v souborech dat časové řady).
  • Group Funkce
    • Funkce group umožní uživatelovi získat výsledky pro celou tabulku v jediném příkazu.

Využití dat

Jak už je zřejmé z dosavadního textu, tak census.gov poskytují podrobné statistiky, které jsou nesmírně důležité pro průmyslová odvětví a komunity. Obchodní sdružení, obchodní komory a podniky spoléhají na tyto informace pro ekonomický rozvoj, obchodní rozhodnutí a strategické plánování.

Obrázek 7: Znázornění možností využití dat z census.gov; zdroj: census.gov

Reálné příklady využití v praxi

Na webu census.gov lze najít sekci „Real-Life Use Cases“, kde je shrnuto šest reálných příkladů využití poskytnutých dat. Níže uvádím tři vybrané příklady:

1. Přehodnocení stávajícího většího podniku – výrobce užitkových vozů

Výrobce užitkových nákladních vozidel pravidelně přezkoumával svou síť prodejců a opravárenských zařízení po celých USA. Byli rádi, že většina jejich zařízení vykázala vysoké skóre spokojenosti zákazníků z průzkumů, které provedli se svými zákazníky, ale byli zklamáni, když viděli, že někteří nedělali tak dobře. Počty podniků (instalatérské a elektroinstalační firmy), které obvykle používaly svá vozidla v oblastech pokrytých službami, byly zjištěny (na mapě) pomocí obchodních údajů ze sčítání lidu. Nahoře překryli mapu svých servisních středisek a odhalili oblasti s mnoha potenciálními zákazníky. Také si všimli, že některé oblasti služeb jejich zařízení s nedostatečným výkonem se překrývaly s jinými oblastmi. Pracovníci plánování dokázali přesvědčit manažery, že je třeba zlepšit podnikové procesy pomocí údajů ze sčítání. Aby lépe sloužili svým trhům, dohodli se, že některá zařízení by měla být přesunuta a měla by být otevřena nová zařízení. Hodnocení spokojenosti zákazníků se dramaticky zvýšilo v době, kdy byla dokončena další roční analýza.

cbb-plumbing-knox-county
Obrázek 8: Ukázka reálného využití; zdroj: census.gov

2. Formování daňové politiky – daně z cigaret v Marylandu

Stát Maryland zvažoval zvýšení daní z cigaret a jiných tabákových výrobků. Stát se obával nejen dopadu na spotřebitele tabákových výrobků (a toho, jak by toto zvýšení mohlo ovlivnit schopnost zákazníka je koupit), ale také dopadu na společnosti, které prodávají tabákové výrobky ve státě. Státní zaměstnanci použili údaje o produktových řadách z ekonomického sčítání ke klasifikaci typů dotčených podniků a ke stanovení rozsahu účinků. Tato čísla odhalila, že obchody s potravinami jsou nejoblíbenějšími prodejci tabákových výrobků v Marylandu, což představuje 18,1 procenta (121,2 milionu USD) z celkového prodeje. S využitím údajů Census Bureau o velikosti firmy zjistili, že drtivá většina obchodů s potravinami zaměstnává méně než pět lidí. Po studii údajů se státní úředníci rozhodli nezvýšit tyto daně kvůli možným negativním dopadům na malé podniky.

3. Otevření nové malé firmy – prodejna kol v Portlandu v Oregonu

Úspěšný špičkový výrobce komponentů pro horská kola zvažoval otevření vlastního obchodu s jízdními koly, aby mohl prodávat své výrobky i horská kola a další příslušenství. Identifikoval potenciální zákazníky (mladé profesionály se středním až vysokým středním příjmem domácnosti) pomocí údajů z průzkumu ACS. Použil údaje ze sčítání, aby určil umístění obchodů se sportovními potřebami (NAICS 451110, který zahrnuje obchody s jízdními koly). Tato zjištění nejen zavedla potenciální konkurenty pro jeho společnost, ale také podniky, se kterými mohl spolupracovat otevřením pronajatého oddělení ve větším obchodě. Byl také schopen porovnat mezd na zaměstnance, výnosy na zaměstnance a další statistiky pro devět oblastí, které zvažoval, pomocí statistik trhu ze sčítání lidu, což mu poskytlo lepší pochopení jeho oboru a toho, co by měl očekávat od svých zaměstnanců. Tyto údaje byly použity v jeho podnikatelském plánu a žádosti o půjčku na počáteční kapitál, kterou předložil místnímu věřiteli pro malé podniky.

Závěr

Census.gov je nesmírně důležitý web nejen pro jednotlivé uživatele v US či v zahraničí, ale i pro další externí informační zdroje, které spoléhají na tyto data. Posláním Úřadu pro sčítání lidu je sloužit jako přední poskytovatel kvalitních údajů o svých lidech a ekonomice. Pro jednotlivé uživatele může být tento informační zdroj zajímavý zejména svojí jednoduchostí a vytvářením specifických dashboardů či reportů přes poskytované nástroje.

Nad fundamenty portálu census.gov lze pohlížet z české perspektivy jako nad CZSO, nicméně oba portály se ve výsledné podobě poskytovaných informací mírně liší. Např. CZSO nenabízí souhrnné specifické reporty pro podnikatele dle lokality a odvětví, ale nabízí jiný typ reportů (např. statistický bulletin dle kraje).

Zdroje

  1. UNITED STATES CENSUS BUREAU. Census Data API User Guide. Census.gov [online]. United States Census Bureau, 2021 [cit. 2021-5-8]. Dostupné z: https://www.census.gov/content/dam/Census/data/developers/api-user-guide/api-guide.pdf
  2. UNITED STATES CENSUS BUREAU. Guidance for Economic Census Data Users [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/programs-surveys/economic-census/guidance.html
  3. UNITED STATES CENSUS BUREAU. QuickFacts [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/quickfacts/
  4. UNITED STATES CENSUS BUREAU. Census Business Builder [online]. [cit. 2021-5-8]. Dostupné z: https://cbb.census.gov/

Data.gouv.fr – štátny zdroj informácií Francúzska

0

Úvod

V dnešnej dobe, ktorá poskytuje množstvo dostupných informácií je čím ďalej náročnejšie orientovať sa, ktoré zdroje na získavanie informácii je potreba si zvoliť. S neustále narastajúcimi zdrojmi, ktoré internet poskytuje je časovo náročné  vybrať si práve tie zdroje, ktoré budú obsahovať presne informácie, ktoré potrebujeme a ich vypovedajúca hodnota je pravdivá.

Informačný zdroj data.gouv.fr

Tento post popisuje platformu slúžiacu na  šírenie verejných údajov francúzskeho štátu „data.gouv.fr“, ktorej prvá verzia bola vyvinutá agentúrou Logica pod vedením predsedu vlády Francoisa Fillona a spustená 5.12.2011. V decembri 2013 bola spustená druhá verzia spoločnosťou Etalab.

Nové stránky sú však už vyvíjané interne, založené na bezplatnom softvéri „Comprehensive Knowledge Archive Network“ (CKAN) vyvinutom prostredníctvom Open Knowledge Foundation. Od roku 2014 je stránka vyvíjaná na špecifickom softvéri s názvom udata. Zdrojový kód softvéru uData je publikovaný na serveri Github a sprístupnený pod GNU Affero General Public License.

Stránka je síce vo francúzskom jazyku a však je možné hore v záložke zmeniť jazyk na angličtinu.

Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor]

Vyhľadávanie v repozitári data.gouv.fr

Vyhľadávať požadované informácie v repozitári data.gouv.fr je možné viacerými spôsobmi.

1. Vyhľadávanie pomocou políčka Search, ktoré nám ponúkne najpopulárnejšie data-sety, reuses a organizations, ktoré sa týkajú kľúčového slova, ktoré sme zadali. Ukážeme si to na príklade slova „COVID“.

Obrázok 2: Úvodná stránka data.gouv.fr vyhľadávanie v repozitári pomocou Search [zdroj obrázku: autor]

2. Vyhľadávanie pomocou Data-Setov v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné data-sety, ku dňu 8.5.2021 dostupných 36 885, z repozitára, ktoré si vieme následne zoradiť na základe nasledujúcich kritérií:

  • Dátum vytvorenia
  • Množstvo odberateľov
  • Naposledy modifikované
  • Množstvo prepoužití
  • Titul

Po výbere kritérií si vieme zvoliť zoradenie od maxima po minimum alebo naopak. Na danej záložke je možnosť exportu data-setov alebo zdrojov podľa potreby do formátu csv.

V danej sekcii je taktiež možné data-sety filtrovať na základe nasledujúcich filtračných podmienok:

  • Organizácií
  • Badges
  • Tags
  • Licencií
  • Časového pokrytia
  • Priestorového pokrytia
  • Teritoriálnej granularity
  • Formátov
  • Podľa frekvencii prepužití

Aby sme správne porozumeli čo sa pod danými filtračnými podmienkami skrýva uvedieme si 5 najčastejšie používaných hodnôt pre jednotlivé filtračné podmienky. Tieto hodnoty vrátane filtračných podmienok ponecháme v anglickom jazyku aby nedošlo k zmene vypovedajúcej hodnoty kvôli nepresnému prekladu. V tabuľke budú taktiež znázornené počty data-setov, ktoré budú zobrazené po zafiltrovaní.

Organizations
ValuesCounts
Departmental Directorate of the Cher Territories1017
Departmental Directorate of Territories and the Sea of ​​the Somme999
Departmental Directorate of Ariège Territories908
Ile-de-France region883
Datalocal resource center759
Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor]
Badges
ValuesCounts
 361
Openfield 16 96
Nec Mergitur 54
Base Local Address 12
Reference Data 9
Tabuľka 2: Filtrovanie podľa Badges [zdroj tabuľky: autor]
Tags
ValuesCounts
open-data15810
gateway-inspires15727
geoscientific-information5164
cadastral planning5018
land-use4641
   Tabuľka 3: Filtrovanie podľa Tags [zdroj tabuľky: autor]
Licenses
ValuesCounts
Open License / Open License version 2.022857
Open License / Open License5448
Open Data Commons Open Database License3758
License Not Specified3257
Other (Attribution)136
Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor]
Temporal coverage
ValuesCounts
From 01/01/0199N/A
Till 12/31/2108N/A
 Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor]
Territorial granularity
ValuesCounts
Other17374
French town1564
Country924
French country600
French intermunicipal (EPCI)556
Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor]
Formats
ValuesCounts
json24391
shp20256
csv15126
zip13824
document4988
Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor]
Known reuses
ValuesCounts
Never reused32204
Little reused1301
Quite reused80
Heavily reused56
Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor] 
Spatial coverage
ValuesCounts
World7092
European Union7005
France6959
Metropilitan France3674
Occitania1011
Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor]

3. Vyhľadávanie pomocou Reuses v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné reuses, ku dňu 8.5.2021 dostupných 2 654, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre data-sety kritériá navyše doplnené o data-sety. Reuses taktiež zobrazujú z koľkých data-setov sú zhotovené.

Rovnako ako aj pre data-sety aj reuses vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:

  • Organizations
  • Badges
  • Type
  • Tags
  • Datasets
  • Followers

4. Vyhľadávanie pomocou Organizations v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné organizácie, ku dňu 8.5.2021 dostupných 2 816, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre reuses kritériá doplnené o reuses.

Rovnako ako aj pre reuses aj organizations vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:

  • Datasets
  • Badges
  • Reuses
  • Followers

Ďalšími dostupnými zdrojmi dát, ktoré je možné využiť v rámci data.gouv.fr sú nasledujúce dokumentácie:

Technické dokumentácie dostupné na: https://doc.data.gouv.fr/

Open data guides dostupné na: https://guides.etalab.gouv.fr/

Pre prehľadnosť je možné využiť dashboard:

Obrázok 3: Dashboard pre data.gouv.fr [zdroj obrázku: autor]

Pridávanie do repozitára data.gouv.fr

Webový portál neslúži len na dohľadávanie informácií ale taktiež umožnuje informácie nahrávať. Nahrávanie je možné už hore zmienených datasetov, reuses a organizácií .

Obrázok 4: Nahrávanie dát do data.gouv.fr [zdroj obrázku: autor]

Podmienkou nahrávania informácii je však registrácia a následné prihlásenie na webový portál.

Závěr 

Webový portál data.gouv.fr je globálny register, ktorý obsahuje primárne dáta týkajúce sa francúzska ako krajiny. Ucelené oblasti informácií, ktoré chceme dohľadať vieme pekne filtrovať na základe datasetov a zoradiť si ich podľa potreby. Jedná sa o otvorenú platformu pre francúzske verejné informácie. Na príklade môžeme vidieť, že množstvo aktuálne publikovaných informácii alebo čerstvo pridávaných informácií sa týka najmä COVID problematiky a dopadmi, ktoré na Francúzsko táto pandémia má. Cieľom data.gouv.fr však nie je poskytnúť informácie len občanom francúzska ale rovnako aj ostatným užívateľom, ktorí sa chcú dozvedieť viac, či už o politických záležitostiach francúzska ale rovnako aj kultúre, ekonomike, práve, transporte alebo ostatných oblastí týkajúcich sa francúzska obsiahnutých vo viac ako 36 000 datasetov.

Zdroje

[1] data.gouv.fr – Registry of Research Data Repositories [online]. [cit. 8.05.2021]. Dostupné z: https://www.data.gouv.fr/en/

Zoznam obrázkov

Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor] 1

Obrázok 2: Úvodná stránka data.gouv.fr vyhľadávanie v repozitári pomocou Search [zdroj obrázku: autor] 2

Obrázok 3: Dashboard pre data.gouv.fr [zdroj obrázku: autor] 5

Obrázok 4: Nahrávanie dát do data.gouv.fr [zdroj obrázku: autor] 6

Zoznam tabuliek

Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor] 3

Tabuľka 2: Filtrovanie podľa Badges [zdroj tabuľky: autor]   Tabuľka 3: Filtrovanie podľa Tags [zdroj tabuľky: autor] 3

Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor] 3

Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor] 4

Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor] 4

Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor] 4

Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor] 4

Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor] 4

Europeana – kultúrne bohatstvo Európy pod jednou strechou

0

Úvod

Krajiny silne závislé na príjmoch z odvetvia cestovného ruchu dnes čelia náročným chvíľam. COVID-19 spustil jednu z najväčších hospodárskych kríz, akú kedy svet zažil. Európska komisia preto zintenzívnila svoju podporu sektora cestovného ruchu a širokej verejnosti poskytla príležitosti na objavovanie rozmanitej kultúry a prírody krajín v rámci Európy. [1]

Sprístupnenie kultúrneho dedičstva Európy verejnosti dnes napomáha v rade spôsobov a miest, kde sa spoločnosť k cestovaniu nemôže a nedokáže dostať. Požívatelia portálu Europeana sú odľahčení od prekážok reality a s pokojom skúmajú významné kultúrne miesta, objekty, umelecké diela a príbehy viažuce sa k európskym krajinám. [2]

Portál Europeana spája ľudí rôznych kultúr či generácií tým, že im pomáha zdieľať ich osobné príbehy viažuce sa k udalostiam ako 1. svetová vojna, Pád železnej opony r. 1989 a i.. Pôvodné príbehy v kombinácii so známymi historickými rozpravami a faktami združujú spomienky osôb s bohatou európskou históriou pod jednou strechou. K dnešnému dňu bolo zozbieraných 50 000 objektov a príbehov týkajúcich sa 1. svetovej vojny. [2]

1. Europeana

Europeana aktívne podporuje online dostupnosť kultúrneho dedičstva a jeho opätovné využitie dnes už takmer 14. rok. Tvrdá práca v súčasnosti prináša svoje zrelé ovocie v podobe viac ako 58 miliónov zdigitalizovaných kultúrnych predmetov z 3 700 knižníc, archívov, múzeí a zbierok. Obsahová stránka portálu odráža európske dejiny z pravekej histórie až k súčasnosti pokrývajúc rôzne témy z umenia a módy až k fotografii a športu počnúc. Portál Europeana poskytuje svoje služby bezplatne a medzi jej primárnych používateľov radíme učiteľov spolu so študentmi. Základnú štruktúru portálu zachytáva obrázok 1. [1] [3]

Obrázok 1: Základná štruktúra portálu Europeana [2]

1.1 3D obsah portálu

Portál disponuje obvyklým textovým či grafickým obsahom a svojim používateľom tiež ponúka audio či video záznamy. Osoba je v ňom dokonca schopná dohľadať 3D reprezentáciu historickej pevnosti či objektu, viď obrázok 2. 

Obrázok 2: 4D reprezentácia pevnosti The Peñíscola Castle [4]

Zobrazenie 3D modelu dokáže používateľ upravovať na základe svojich osobných preferencií. Okrem základných funkcionalít nastavenia akými sú priblíženie, oddialenie a 360° otáčanie mu portál Europeana ponúka detailnú ukážku miestností, ktorou pevnosť The Peñíscola Castle disponuje. Po zvolení niektorého z číselných indexov sa 3D ukážka automaticky zameria na vybranú časť pevnosti. Používateľ tak dokáže vstrebať aj tie najmenšie detaily, ktorými historická stavba dominuje. Prehliadku pevnosti sprevádza tiež zvukový komentár objasňujúci k čomu daná miestnosť označená číselným indexom v minulosti slúžila. Portál Europeana disponuje hneď niekoľkými jazykovými variantami, v ktorých si osoba môže historický výklad vypočuť. UI prostredie takéhoto štýlu získavania informácií zobrazujú obrázky 3-4. 

Obrázok 3: Detail pevnosti označený č. indexom 7 [4]
Obrázok 4: Detail miestnosti označený č. indexom 16 [4]

Každý nájdený objekt je okrem vizuálnej či zvukovej ukážky doplnený o základný popis hlavných faktov, ktoré používateľa môžu zaujímať, viď obrázok 5. Výsledky hľadania majú tiež presne špecifikované pravidlá ich zdieľania a opätovného použitia.  

Obrázok 5: Základný popis pevnosti The Peñíscola Castle [4]

Jeden príkaz – mnoho výsledkov, aj týmto štýlom možno opísať portál Europeana. Osoba zameraná na konkrétnu tematiku je schopná získať obsiahle informácie o mnohých objektoch v krátkom časovom úseku, vďaka automatizovanému procesu hľadania, viď obrázok 6.  

Obrázok 6: Rýchly proces hľadania objektov spadajúcich pod jednu tematiku [4]

Portál Europeana dopĺňa výsledky hľadania o detailnú charakteristiku ich technických či historických metadát. V prípade pevnosti The Peñíscola Castle sú uvedené informácie o časovom období, dátume vytvorenia digitálnej podoby objektu či proveniencie, viď obrázok 7. 

Obrázok 7: Detailné metadáta nájdeného objektu [4]

V neposlednom rade je používateľovi umožnené mapové zobrazenie nájdeného objektu s presnými zemepisnými súradnicami, viď obrázok 8.

Obrázok 8: Mapové zobrazenie nájdeného objektu [4]

1.2 Textový obsah portálu

Textový obsah portálu Europeana je vo veľkej miere zastúpený novinovou tlačou. Používateľovi je sprístupnené filtrovanie možností hľadania výsledkov podľa požadovaného dátumu či jazyka, viac v kapitole 1.4. Reálnu ukážku nemeckej tlače z apríla r. 1881 zobrazujú prílohy obrázok 9-10. V ľavom bočnom panely sa používateľovi automaticky zobrazí anotačný blok, ktorý mu zľahčuje orientáciu v tlačenom texte novín. Osoba môže voľne listovať stránkami tlače a ich vizuálnu ukážku prispôsobovať vlastným preferenciám. V prípade, že osoba pátra po špecifickom výraze, je možné proces hľadania drasticky skrátiť a miesto prechádzania naprieč všetkými stranami novín je možné hľadaný výraz vložiť do textového poľa, ktoré automaticky zobrazí nájdené výsledky, ak je hľadaný pojem v tisku prítomný. Praktickú ukážku znázorňuje príloha obrázok 10, kde dochádza k hľadaniu nemeckého pojmu „Anzeige“ naprieč novinovým textom. 

Obrázok 9:Nemecký tisk z apríla r. 1881 [5]
Obrázok 10: Výsledky hľadania pojmu „Anzeige“ naprieč novinami [5]

Obdobne ako tomu je vo vyššie uvedenom príklade hľadania 3D objektu pevnosti The Peñíscola Castle, aj v prípade textového obsahu portál Europeana zaznamenáva detailnú charakteristiku metadát, akou je napr. jazyk novinového výtlačku, rozsah či dátum vydania, viď obrázok 11. 

Obrázok 11:Detailné metadáta nájdeného objektu [5]

1.3 Video, Audio obsah portálu

Video či audio záznamy sú v portáli Europeana zastúpené v početnom množstve rôznych tematík, počnúc od hudobných koncertov až po záznamy z 1. svetovej vojny. Súčasťou portálu je tiež integrovaný video/audio prehrávač, ktorý používateľom zaručuje pohodlné prezeranie výsledkov hľadania. Obrázkové prílohy 12-13 slúžia ako ukážka video záznamu z obdobia 1. svetovej vojny na území bývalého ČSR. Obrázok 12 obsahuje zoznam kľúčových slov, pod ktorým je možné dané video nájsť. Naopak obrázok 13 reprezentuje metadáta, ktoré v prípade video záznamu uvádzajú jazyk a produkčnú krajinu filmu, dátum vytvorenia a miesto udalosti. 

Obrázok 12: Ukážka video záznamu z obdobia 1. svetovej vojny [6]
Obrázok 13: Detailné metadáta nájdeného objektu [6]

1.4 Prehľadávanie portálu

Používateľ je na portáli Europeana schopný prezerať všetky položky rôzneho druhu ešte skôr než začne s procesom vyhľadávania informácií. Portál Europeana dáta kategorizuje do piatich typov: [7]

  • Text: knihy, listy, archívne papiere, dizertačné práce, básne, novinové články, faksimile, rukopisy a hudobné podklady
  • Obrázky: obrazy, kresby, výtlačky, fotografie, obrázky múzejných objektov, mapy, grafických vzorov, plánov a hudobného notácie
  • Video: filmy a televízne programy
  • Zvuk: pásky, disky a rozhlasové vysielania
  • 3D: virtuálne 3D reprezentácie objektov architektúry alebo miest

UI prostredie portálu je dostatočne intuitívne a logické. Osobám poskytuje prehľad o zastúpenom type médií vo vybranej zbierke (Art, Fashion, Sport a i.), možnostiach opätovného použitia nájdených výsledkov pre osobné účely či aktuálne počty objektov vo zvolených kategóriách. Obrázky 14-16 znázorňujú proces prehľadávania objektov v zbierke Arts

Obrázok 14: Proces prehľadávania objektov – filtrovanie podľa typu média [8]
Obrázok 15: Proces prehľadávania objektov – filtrovanie podľa opätovného použitia [8]
Obrázok 16: Proces prehľadávania objektov – filtrovanie podľa krajiny [8]

V kapitole 1.2 zaoberajúcou sa textovým obsahom portálu je uvedený príklad nemeckej tlače z apríla r. 1881. V prípade, kde osoba hľadá špecifický dátum vydania je možné využiť rozšírenú ponuku filtrovania výsledkov, a to spôsobom zadania konkrétneho dátumu či iných osobných preferencií, ako znázorňuje príloha na obrázku 17. 

Obrázok 17: Rozšírené prehľadávanie objektov na základe osobných preferencií [9]

1.5 Vyhľadávanie v portáli

Portál Europeana disponuje priamym spôsobom získavania nových informácií. V prípade, kde osoba pozná predmet svojho hľadania sa ponúka použiť nasledovný princíp: [7]

  • Who: meno osoby resp. tvorcu. Príkaz who: Vincent van Gogh vyhľadá umelecké diela svetoznámeho maliara. Naopak, týmto štýlom nie sme schopní získať záznamy o jeho osobnom živote.
  • What: typ položky, predmetu alebo kľúčového slova hľadanej veci. Príkaz what: Art Nouveau“ zobrazí umelecké diela, budovy a pamiatky Art Nouveu.
  • Where: názov miesta. Príkaz where: Milan zobrazí objekty, ktorých vznik sa datuje k územiu Milána alebo sa aktuálne v Miláne nachádzajú. Portál Europeana počíta aj s jazykovou diferenciou, a preto v prípade príkazu where: Milano alebo Mailand či Milanas zobrazí používateľovi rovnaké položky viažuce sa k danej geografickej oblasti.
  • When: dátum. Príkaz when: 1984“ vyhľadá položky z r. 1984. Obdobným príkazom je „YEAR:1984“ alebo „YEAR:[1525 TO 1527]“, ktorým môžeme vymedziť nami požadované časové obdobie. 

1.5.1 Pokročilé vyhľadávanie

Zaužívané techniky pokročilého hľadania sa ničím nelíšia ani na portáli Europeany. Osoba dokáže vyhľadať frázu za pomoci úvodzoviek či využiť známe operátory: [7]

  • AND: nájde výsledky, ktoré obsahujú všetky zadané slová, napr. salt AND pepper. Operátor je možné nahradiť postupnosťou znakov && alebo +.
  • OR: nájde výsledky, ktoré obsahujú aspoň jedno zo zadaných slov, napr. salt OR pepper. Operátor je možné nahradiť postupnosťou znakov ||.
  • NOT: vylučuje výsledky, ktoré obsahujú zadané slovo, napr. salt NOT pepper. Operátor je možné nahradiť znakom  alebo !.

V prípade potreby portál Europeana tiež podporuje funkcionalitu tzv. zgrupovania za pomoci využitia zátvoriek, napr. “(salt AND pepper) AND cooking”.

Ďalšie operátory pokročilého vyhľadávania záznamov, akými sú alebo či ~ sú portálom Europeana podporované v plnom rozsahu: [7]

  • Operátor *: nájde slová s ľubovoľným počtom písmen, napr. „ca*“ zobrazí položky ako cat, cap, cane, cable, canary a i..
  • Operátor ?: nahrádza jedno písmeno v zadanom slove, napr. „ca?e“ zobrazí položky ako cane, care, case a i.. Operátor ? nachádza využitie najmä v prípadoch, v ktorých si osoba nie je istá správnosťou pravopisu.
  • Operátor ~: nájde položky s podobným pravopisom, napr. „text~“ zobrazí položky ako test, texts a i..

1.6 Využitie portálu

Portál Europeana disponuje bohatým obsahom rozličných tematík. Ako už vyššie kapitoly uvádzajú, osoba dokáže získať poznatky z historickej novinovej tlače alebo si svoje vedomosti prehĺbiť v starovekých pevnostiach. Okrem iného však portál tiež uchováva archívne zábery z módnych mól popredných návrhárov, ktorých výsledky používateľ dokáže detailne filtrovať na základe výberu:

  • Dizajnéra
  • Typu položky ako haute couture, fashion show, fashion collection či typ odevu/doplnkov/obuvi
  • Farby
  • Orientácie obrázka
  • Veľkosti obrázka 
  • Jazyku
  • Inštitúcie
  • Formátu súboru

Osoba má na výber z celkového počtu 43 zbierok rôznych tematík abecedne zoradených. Portál tiež ponúka vyhradenú sekciu pre pedagógov, študentov či rodičov, ktorá disponuje selekciou overených vzdelávacích zdrojov pravidelne aktualizovaných na základe diania vo svete. 

Naše kultúrne dedičstvo spája minulosť, súčasnosť a budúcnosť. Na podporu cestovného ruchu, EÚ preto vyhradila na portáli Europeana osobitnú časť: Discovering Europe , ktorá používateľa prevedie virtuálnou cestou po Európe z pohodlia jeho domova. [1]

Posledné výskumy uvádzajú zistenie, až 40% turistov si dnes vyberá svoju dovolenkovú destináciu na základe jej kultúrneho dedičstva a histórie. [1]

Zoznam použitej literatúry

[1] The Europeana platform [online]. Oficiálna webová stránka European Commission. URL: https://digital-strategy.ec.europa.eu/en/policies/europeana. Cit. 2021-03-21.

[2]       Europeana – the case for funding [online]. Dostupné z: http://www.eblida.org/News/Europeana%20-%20The%20Case%20for%20Funding.pdf. Cit. 2021-03-21. 

[3]       Nuno Freire. Data interoperability in cultural heritage: the Europeana approach [online]. EUDAT Conference, Rím, Október 2013 Dostupné z: https://www.eudat.eu/sites/default/files/NunoFreire.pdf. Cit. 2021-04-05.

[4]       Castillo de Peñíscola │Castellón │ España [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/181/share3d_796. Cit. 2021-04-05. 

[5]       Anzeiger zum Pustertaler Boten – 1881-11-04 [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/9200333/BibliographicResource_3000115223398. Cit. 2021-04-05. 

[6]       Slavný návrat 1. pl. Mistra Jana Husi do vlasti 2. II. 1920 – 1881-11-04 [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/08615/3900769_01. Cit. 2021-04-05. 

[7]       Searching and Browsing [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/en/help/search-tips. Cit. 2021-04-05.

[8]       Art [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/collections/topic/190-art. Cit. 2021-04-05.

[9]       Newspapers [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/collections/topic/18-newspapers. Cit. 2021-04-05.

MarineTraffic: sledujte polohu plavidel nejen v rámci oceánů

0

Úvodní představení

Společnost MarineTraffic (2021a) je světový leader v poskytování informací o poloze plavidel a námořním zpravodajství. Společnost si dává za cíl zjednodušit přístup k užitečným datum.

Obr. 1 Logo společnosti MarineTraffic(2019)
Obr. 1 Logo společnosti MarineTraffic(2019)

Hlavní přidaná hodnota, kterou společnost vytváří spočívá v monitorování pohybu plavidel. MarineTraffic staví svůj úspěch na sběru dat ze celé sítě pobřežních přijímačů AIS1 doplněných informace ze satelitů. Takto sesbíraná data jsou zpracována a integrují informace z dalších komplementárních zdrojů. Cílem je poskytnout užitečné informace o lodních aktivitách, které jsou aplikovatelné v zasilatelském, obchodním a logistickém průmyslu.

Hlavní kanceláře společnosti se nacházejí v Spojeném království, Řecku a Singapuru. Společnost má také lokální zastoupení u všech hlavních globálních námořních uzlů, tak aby mohla poskytovat služby na míru lokálních požadavků. MarineTraffic prohlašuje, že je skutečně globálním hráčem s miliony uživatelů jeho služeb.

MarineTraffic se dává za cíl poskytovat transparentní informace a pozitivním způsobem posouvat svět námořní dopravy kupředu. Proto společnost spolupracuje s mezinárodními námořními organizacemi jako je například UNCTAD2. Kromě toho MarineTraffic významně spolupracuje s největšími přístavy a rejdařstvími na světě s cílem zlepšit jejich efektivitu.

Na Wikipedii (2020a) heslo MarineTraffic popisuje otevřený komunitní projekt, poskytující informace o pohybech plavidel v reálném čase. Služba byla spuštěna v roce 2007 jako akademický projekt na Egejské univerzitě v Řecku pod vedením profesora Dimitriase Lekkase. Služba je lokalizovaná do 35 jazyků včetně češtiny.

Databáze tohoto projektu obsahuje informace o plavidlech včetně jejich aktuální i historické polohy, rozměry, tonáž nebo například číslo IMO3. Kromě toho mohou uživatelé sdílet fotografie těchto plavidel a navzájem si tyto fotografie hodnotit. Databáze pro finální prezentaci využívá kombinované mapové podklady složené ze služeb Google Maps API a OpenStreetMap.

Základní služba sledování plavidel je poskytována zdarma a zejména pro profesionály jsou nabízený placené prémiové služby. Wikipedické heslo uvádí 600 000 registrovaných uživatelů k roku 2015, ale celkově služba eviduje 2 000 000 unikátních uživatelů měsíčně. Služba je také dostupná formou aplikace pro mobilní zařízení s operačními systémy iOS a Android. (MarineTraffic 2021d)

 Jak již bylo zmíněno výše, tak MarineTraffic využívá služby pobřežních AIS přijímačů. Wikipedie dále upřesňuje, že těchto je ve více než 140 zemích světa celkově více než 18 000 přijímačů, a které jsou spravovány dobrovolníky zapojenými do tohoto projektu. Což činní službu velmi závislou na své komunitě. K 27.3.2021 databáze evidovala pohyby 224 533 plavidel během posledních 24 hodin. Protože se má projekt akademické kořeny tak se společnost MarineTraffic kromě rozvoje samotné služby významně věnuje také výzkumu včetně publikování ve spolupráci s univerzitami. Věnuje se zejména oblastem databázových systémů a AI. (MarineTraffic 2021f)

Rešeršní možnosti

Celý produkt této společnost lze rozdělit na dvě velké části, které následně rozlišují takým způsobem lze v této databázi vyhledávat. Těmito dvěma částmi jsou Online services a Data services, přesněji API4 rozhraní k celé databázi. Přesněji Online services nabízejí uživatelsky přívětivé rozhraní, skrze které se lze dotazovat, analyzovat či vizualizovat podkladová data obsažené v Data services. Omezená funkcionalita Online services je nabízena zdarma, avšak přístup k ryzím datům skrze Data services je kompletně zpoplatněn.

V rámci seznámení se MarineTraffic neměl autor této práce možnost si prakticky otestovat práci s Data services. Přesto lze předpokládat že jsou touto cestou zpřístupněny všechny informace obsažené v databázi, a to včetně těch které nejsou jinak zpřístupněny skrze Online services. API rozhraní je primárně cíleno pro byznysové užití. Dle dokumentace, API pomocí HTTP5 protokolu na základě dotazu vrací odpověď ve formátu XML6, CSV7 nebo JSON8.

Obr. 2 ukázka XML odpovědi (MarineTraffic 2021b)
Obr. 2 ukázka XML odpovědi (MarineTraffic 2021b)

Nyní se však soustřeďme na možnosti vyhledávání pomocí Online services. Na hlavním vstupním bodu webové stránky je uživateli rovnou prezentována Živá mapa zobrazující informace, které databáze obsahuje k zobrazené oblasti. Tedy všechny plavidla, přístavy či další významné entity které se aktuálně nacházejí v zobrazené lokalitě. Samozřejmě jednotlivé body na mapě lze dále rozkliknout a zobrazit si tak detailní informace k dané entitě.

Obr. 3 ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla (MarineTraffic 2021i)
Obr. 3 ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla (MarineTraffic 2021i)

V rámci Živé mapy lze vyhledávat entity nejen skrze mapu, ale také pomocí vyhledávacího pole. V uživatelské nápovědě jsem nenalezl informaci, že vyhledávací pole podporovalo jakýkoliv zvláštní vyhledávací syntax či operátory. Uživatelské rozhraní nabízí pouze filtrování výsledků tyto skupiny entit:

  • Plavidla
  • Přístavy
  • Oblasti
  • Moje flotila
  • Moje poznámky
  • Společnosti

  • Stanice
  • Majáky
  • IMO
  • MMSI9
  • Fotografové
  • Zprávy

Obr. 4 ukázka uživatelského rozhraní pokročilého vyhledávání (MarineTraffic 2021h)
Obr. 4 ukázka uživatelského rozhraní pokročilého vyhledávání (MarineTraffic 2021h)

Online services nabízejí k vyhledávání, kromě jednoduchého vyhledávacího pole v rámci Živé mapy, pokročilé vyhledávání Explore, kde lze vyhledávat pomocí velkého množství parametrů které databáze eviduje. Kvantitativní parametry lze dále omezovat na vybrané intervaly a kvalitativní parametry zase pomocí operátorů in a not in. Případně lze kombinovat vyhledávaní pomocí vícero parametrů současně. Pokročilé vyhledávání některých entit je však zpoplatněno a stejně tak je zpoplatněn také jakýkoliv export výsledků vyhledávání.

Popis indexu

Typologie dat jsou zde popsány dle členění datasetů nabízených v rámci Data services. Jedná o pět hlavních kategorií, které se dále dělí na 25 skupin, datasetů. (MarineTraffic 2021c)

První kategorie řeší problematiku určení přesné polohy plavidel a obsahuje následující data sety:

  • Historická trasa plavidla
  • Pozice plavidel ve statické flotile
  • Pozice plavidel ve dynamické flotile
  • Pozice plavidla v přístavu
  • Pozice plavidla ve vybraných oblastech
  • Pozice plavidla ve vlastní oblasti
  • Aktuální pozice plavidla

Druhá kategorie je věnována informačním zprávám a událostem. Plavidla jsou povinna veřejně hlásit určité události. Tato kategorie obsahuje následující data sety:

  • Volání přístavu (zejména informace o vstupu a opuštění přístavu plavidlem)
  • Události plavidla (všechny události s vazbou ke konkrétnímu plavidlu)
  • Volání kotviště (obdoba volání přístavu, ale pro spravovaná kotviště)

Kategorie Data plavidel je věnována detailním informacím a parametrům plavidel:

  • Fotografie plavidla
  • Parametry plavidla
  • Vyhledání plavidla (vrací URI10 plavidla v rámci databáze MarineTraffic)

Čtvrtá kategorie je věnována plánování plavby:

  • Předpověď cesty (vrací očekávané průjezdní body, vzdálenosti a čas plavby)
  • Očekávané příjezdy (vrací seznam plavidel očekávaných v přístavu)
  • Vzdálenosti přístavů a plavebních cest
  • Odhadovaná destinace (vrací předpověď 5 nejpravděpodobnějších cílů plavidla)
  • Odhadovaný příjezd (jako Odhadovaná destinace, ale na základě jiného modelu)
  • Provoz v přístavu (poskytuje informace o čekacích dobách plavidel)
  • Očekávaný čas příjezdu do přístavu

Poslední kategorie je věnována správě účtů v rámci celého produktu MarineTraffic:

  • Změna flotily
  • Plavidla ve flotile
  • Flotily
  • Zůstatek kreditů
  • Vyprázdnění flotily

Přístup ke všem data setům je zpoplatněn. Přístup lze platit většinou dvěma způsoby. Prvním je kreditový systém, který je dostupný pouze u některých datasetů. Uživatelé si mohou pořídit určitý obnos kreditů které lze následně utrácet za vybrané dotazy skrze API rozhraní. Různé dotazy mohou mít různou cenu. Cenu ovlivňuje volba zdroje, zda se jedná o data ze satelitní sítě AIS nebo ze sítě pobřežních přijímačů AIS. Druhou možností je předplatné, které je dostupné u všech datasetů. Pořízení předplatného je však komplikovanější vzhledem k tomu že je potřeba napřímo kontaktovat poskytovatele. Vždy se jedná o individuální nabídku, a nikoliv službu s předem stanovenou cenou.

Databáze eviduje pozice pohybujících se plavidel v 2 minutových intervalech. U nehybných plavidel je evidována jejich poloha jen každých 20 minut. Databáze sbírá data primárně ze dvou zdrojů. Jak již bylo zmíněno jedním je satelitní přijímače AIS vysílání a tím druhým je pobřežní sít přijímačů AIS vysílání. MarineTraffic vybudoval s pomocí své komunity největší síť přijímačů AIS vysílání na světě. Jednotlivci jsou motivováni k tomu, aby se do této komunity zapojili dvěma způsoby. Prvním je že současní vlastníci AIS přijímačů, kteří se zapojí do této sítě zdarma obdrží navýšení jejich úrovně předplatného služeb MarineTraffic. Naopak těm, kteří nemají AIS přijímač, jsou oblasti, která doposud není dostatečně pokrytá, těm MarineTraffic takový přijímač zdarma poskytne. (MarineTraffic 2021g) Vedlejším zdrojem dat, fotografií, jsou uživateléfotografové, kteří je dobrovolně do databáze nahrávají své fotografie konkrétních lodí.

Příklady užití

Pro identifikaci některých příkladů využití služby MarineTraffic byl kontaktován Jan Poláček ze společnosti Czechoslovak Ocean Shipping, s.r.o. přední české zasilatelské společnosti. Společnost využívá placenou variantu služby Online services, ale již nikoliv přímé rozhraní databáze Data services. Pan Poláček oceňuje zejména jednoduchost použití a přehlednost, když prezentuje výstupy z této služby zákazníkům. Využívají polohu plavidel pro sledování zásilek celou dobu cesty a pružně reagovat na případné zpoždění plavidla upravovat návazné články dopravního řetězce zásilky až k zákazníkovi. Není to je příklad námořní dopravy. V současné době existuje trend sledování zásilek i letecké či automobilové dopravě.

Celý projekt MarineTraffic pochází z akademického prostředí. A zde nachází také mnoho příkladů užití. A například i přístup k Data services lze získat za zvýhodněných podmínek pro akademické užití. Data ze služby MarineTraffic mohou posloužit při manažerských studiích jak ukazuje příklad Martina Jančáka (2018) z Katedry logistiky Fakulty podniko-hospodářské Vysoké školy ekonomické v Praze. Dalšími příklady mohou být pro enviromentální programy studium polární námořní trasy okolo Ruska. Nebo vizualizace hustoty námořní dopravy v kaspickém moři pro geopolitická studia. Za poměrně překvapivé lze označit velmi významné lodní spojení Ázerbájdžánu s Turkmenistánem. Akademické uplatnění této služby je velmi široké. To se ukazuje také na to, že s MarineTraffic spolupracuje sedm univerzit a mnoho specializovaných výzkumných organizací. (MarineTraffic 2021e)

Obr. 5 ukázka využití MarineTraffic pro vizualizaci hustoty provozu v Černém a Kaspickém moři
Obr. 5 ukázka využití MarineTraffic pro vizualizaci hustoty provozu v Černém a Kaspickém moři

V neposlední řadě je potřeba zmínit také námořníky samotné, kteří mohou využívat služeb MarineTraffic pro plánování tras i pro samotnou navigaci. V rámci skupiny Online services jsou nabízeny služby jako plánovaní trasy upravené o meteorologickou předpověď, služby odesílání důležitých námořních zpráv formou notifikací v mobilní aplikaci, nebo navigování v přístavišti. Opět, toto je jen krátký výpis několika málo užití této služby, kterých je celkově mnohem více.

Závěr

Závěr je věnován kratičkému srovnání se službou, která téměř dvojčetem k MarineTraffic, a která přesto vůbec nekonkuruje. Tou službou je velice populární švédský Flightradar24. Jedná se službu fungující na stejném principu jako MarineTraffic akorát místo lodí, jak název napovídá, sleduje pohyby letadel. Oba projekty vznikli mezi lety 2006 a 2007. Oba staví na volně šířených identifikačních signálech, které snímá komunitní síť přijímačů. A klíčem k úspěchu obou služeb byla právě agregace a přehledná vizualizace těchto signálů. Obě služby nabízí své základní online služby zadarmo, ale nabízí také prémiové služby a placené API rozhraní databáze. Seznam společných rysů pokračuje i dále. Jedná se skutečně dvojčata.

Přijímání, agregování a následné distribuování AIS vysílání lze jednoduše replikovat. Přesto není mnoho konkurenčních řešení, které by nabízeli obdobnou komplexitu a množství informací. Co se ukazuje jako snadno nenapodobitelné je komunita uživatelů a tvůrců obsahu v rámci služby. Možná i proto, z celé variety služeb, je to právě MarineTraffic, který je dostatečně atraktivní pro významné světové instituce, aby s ním chtěli spolupracovat.

Aktuální případ nákladní lodi, která uvízla v Suezském průplavu a zcela zastavila tak jednu z hlavní námořních tras, dále ukázala sílu online aktualizovaných dat. (Splash 24/7 2021) Novináři z celé světa, mimo jiné i skrze MarineTraffic, neuroticky sledovali několik dní, zda se jedna tečka na mapě dala již do pohybu.


Poznámky pod čarou

1. AIS neboli Automatic identification system je systém pro sledování pohybů lodí. AIS vysílač v kombinaci s námořním radarem jsou základní nástroje pro navigovaní a vyhýbání se kolizím. AIS signálů využívá VTS (vessel traffic services) pro řízení provozu v přístavech. (Wikipedia 2021b)

2. UNCTAD neboli United Nations Conference on Trade and Development, česky Konference OSN o obchodu a rozvoji je jednou z odborných organizací OSN. Její programy jsou zaměřeny na rozvoj obchodu, obchodní a celní politiku, surovinovou politiku a rozmach rozvojových zemí a jejich ekonomickou integraci. (Wikipedia 2019)

3. Číslo IMO neboli International Maritime Organization number je unikátní identifikátor plavidel, jejich registrovaných majitelů či správcovský společností. (Wikipedia 2021e)

4. API neboli Application Programming Interface v informatice označuje rozhraní, které umožňuje interagovat vícero systémům či aplikacím mezi sebou. (Wikipedia 2021a)

5. HTTP neboli Hypertext Transfer Protocol je internetový protokol pro komunikaci klientů s webový servery, zejména pomocí hypertextových dokumentů. (Wikipedia 2021d)

6. XML neboli Extensible Markup Language je značkovací jazyk. Je snadno čitelný i strojově spravovatelný. Jedná se o jazyk příbuzný HTML. (Wikipedia 2021h)

7. CSV neboli Comma-separated values je jednoduchý formát zápisu tabulkových dat. (Wikipedia 2021c)

8. JSON neboli JavaScript Object Notation je (Wikipedia 2021f)

9. MMSI neboli Maritime Mobile Service Identity je devítimístné unikátní identifikační číslo všech námořních vysílačů (plavidel i pobřežních stanic). Tento identifikátor je využívám i v rámci AIS. (Wikipedia 2020b)

10. URI neboli Uniform Resource Identifier je textový řetězec, který umožňuje jednoznačně určit umístění a název odkazovaného objektu. (Wikipedia 2021g)

Literatura

JANČÁLEK, Martin, 2018. Dovoz tuňákových výrobků z Latinské Ameriky [online]. B.m. [vid. 2021-03-30]. Vysoká škola ekonomická v Praze. Dostupné z: https://vskp.vse.cz/75733

MARINETRAFFIC, 2019. MarineTraffic company logo [online] [vid. 2021-03-27]. Dostupné z: https://mk0snopwdropsolwypn8.kinstacdn.com/wp-content/uploads/2019/11/MarineTraffic_Global-Ship-Tracking-Intelligence_BG-White-1-1.png

MARINETRAFFIC, 2021a. About company [online] [vid. 2021-03-26]. Dostupné z: https://www.marinetraffic.com/cs/p/company

MARINETRAFFIC, 2021b. AIS API Documentation [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/ais-api-services/documentation/api-service:ps01

MARINETRAFFIC, 2021c. AIS API Services [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/ais-api-services

MARINETRAFFIC, 2021d. Mobile apps [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/cs/mobile-apps

MARINETRAFFIC, 2021e. Partnerships Archive. MarineTraffic Research [online]. [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/research/partnership/

MARINETRAFFIC, 2021f. Reserch. MarineTraffic Research [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/research/

MARINETRAFFIC, 2021g. Ship Spotting AIS Receiver – Set up AIS Receiver [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/p/expand-coverage

MARINETRAFFIC, 2021h. Ukázka uživatelského rozhraní pokročilého vyhledávání. MarineTraffic [online]. Dostupné z: https://www.marinetraffic.com/cs/data/?asset_type=vessels&columns=flag,shipname,photo,recognized_next_port,reported_eta,reported_destination,current_port,imo,ship_type,show_on_live_map,time_of_latest_position,dwt,notes&flag_in|in|Czech%20Republic|flag_in=CZ

MARINETRAFFIC, 2021i. Ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/cs/ais/home/shipid:737721/zoom:14

SPLASH 24/7, 2021. Huge Suez operation frees the Ever Given. MarineTraffic.com [online] [vid. 2021-03-30]. Dostupné z: http://www.marinetraffic.com/en/maritime-news/article/36385

WIKIPEDIA, 2019. Konference OSN o obchodu a rozvoji [online]. [vid. 2021-03-26]. Dostupné z: https://cs.wikipedia.org/w/index.php?title=Konference_OSN_o_obchodu_a_rozvoji&oldid=17415477

WIKIPEDIA, 2020a. MarineTraffic [online]. [vid. 2021-03-27]. Dostupné z: https://en.wikipedia.org/w/index.php?title=MarineTraffic&oldid=996814078

WIKIPEDIA, 2020b. Maritime Mobile Service Identity [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Maritime_Mobile_Service_Identity&oldid=995063085

WIKIPEDIA, 2021a. API [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=API&oldid=1014458682

WIKIPEDIA, 2021b. Automatic identification system [online]. [vid. 2021-03-26]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Automatic_identification_system&oldid=1004657806

WIKIPEDIA, 2021c. Comma-separated values [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Comma-separated_values&oldid=1013831687

WIKIPEDIA, 2021d. Hypertext Transfer Protocol [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Hypertext_Transfer_Protocol&oldid=1014703031

WIKIPEDIA, 2021e. IMO number [online]. [vid. 2021-03-27]. Dostupné z: https://en.wikipedia.org/w/index.php?title=IMO_number&oldid=1008929344

WIKIPEDIA, 2021f. JSON [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=JSON&oldid=1015019090

WIKIPEDIA, 2021g. Uniform Resource Identifier [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Uniform_Resource_Identifier&oldid=1015064371

WIKIPEDIA, 2021h. XML [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=XML&oldid=1014223202

JSTOR: podrobný vhled do on-line superzdroje pro humanitní a společenské vědy

0

Co je JSTOR?

JSTOR je digitální knihovna původně především pro akademické potřeby v humanitních a společenských vědách. Online databáze umožňuje fulltextové vyhledávání napříč více než 2600 odbornými časopisy, 100 000 e-knihami a miliony primárních zdrojů. JSTOR nabízí velmi kvalitní zdroje, které jsou povinně podrobeny recenzím odborníků z příslušné vědecké oblasti. Díky dobré pověsti a vysoké kvalitě zdrojů se obsah databáze trvale rozšiřuje o nové obory, např. matematiku, statistiku a techniku.

Primárním cílem JSTORu, při prvním spuštění v roce 1994, bylo vyřešení problémů plynoucích z trvalého růstu odborných publikací a nedostatku místa pro archivaci v univerzitních knihovnách. Digitalizace a centralizace textů vytvořila archiv přístupný odborné veřejnosti z téměř celého světa. V roce 2009 se JSTOR stal jedním z nástrojů neziskové organizace Ithaka (více na Ithaka.org).(JSTOR1)

Požadavkem pro zveřejnění odborného časopisu na této platformě je digitalizace kompletní historie časopisu, tedy od prvního vydání prvního svazku. Naopak nárokem ze strany vydavatelů knih a časopisů je „pohyblivá zeď “, která JSTORu umožňuje zveřejnit plný text publikace v databázi až po uplynutí 3-5 let od vydání. (JSTOR 3 nedatováno; JSTOR 2 nedatováno)

JSTOR nabízí mnoho možností, jak získat přístup k obsahu:

  1. Zdarma a bez registrace: omezená část obsahu je k dispozici komukoliv
  2. Zdarma přes školní nebo veřejnou knihovnu
  3. Individuální účet:
    • funkce organizace a uložení citací nebo poznámek
    • možnost zdarma přečíst 6 článků každých 30 dní (po dobu pandemie covid-19 je počet článků navýšen na 100)
  4. Neomezená placená verze JPASS pro jednotlivce

Pokud studujete nebo pracujete ve vzdělávací instituci, můžete si individuální účet propojit s účtem Vaší instituce, čímž získáte všechen, Vaší institucí předplácený, obsah z domova. (JSTOR 4 nedatováno)

Základní vyhledávání

Představme si, že jsme v literatuře narazili na jméno Adam Smith a kromě pojmu „neviditelná ruka trhu“ o jeho práci nic neznáme. V takovém případě nám bude stačit základní vyhledávání, které se objeví hned při načtení stránky jstor.org.

JSTOR během zadávání zobrazuje přibližný počet odpovídajících záznamů a navrhuje základní filtrování výsledků. My bychom se rádi seznámili s původní prací Adama Smithe, vybereme proto práce, kde je Adam Smith autorem.

AUTOR, 2021. Obrázek 1 Úvodní stránka [online]. 2021. Dostupné z: jstor.org

Výsledky hledání lze filtrovat pomocí panelu na levé straně. Prostřednictvím filtrování můžeme omezit výsledky na určitou formu dokumentu, vymezit časový úsek vydání, vybrat relevantní obory prací nebo zobrazit pouze dokumenty, u kterých máme fulltextový přístup. Vyhledávací pole na levém panelu přidává možnost dodatečného vyhledávání v množině dokumentů, kde je autorem Adam Smith. Výsledky vyhledávání jsou ve výchozím nastavení seřazeny dle relevantnosti, ale pomocí tlačítka nad výsledky můžeme řazení změnit na chronologické.

Pokud využíváme individuálního účtu a máme ke konkrétnímu dokumentu plný přístup, můžeme si ho v plném rozsahu přečíst, sdílet, vytvořit citaci, uložit do JSTOR Workspace nebo stáhnout ve formátu pdf.

AUTOR, 2021. Obrázek 2 Výsledek vyhledávání [online]. Dostupné z: https://www.jstor.org/action/doBasicSearch?Query=au%3A%28%22adam+smith%22%29&acc=on&wc=on&fc=off&group=none&refreqid=search%3A1ce16c88722c9a6c7be3480f0c8b1493

Pokročilé vyhledávání

Pokud máme lepší představu o námi požadované informaci, můžeme využít pokročilé vyhledávání.  JSTOR nabízí vytvoření sekvence klíčových slov v rámci polí, kterými jsou autor, titulek, abstrakt a popis obrázku. Pokud takovou oblast nespecifikujeme, proběhne klasické fulltextové vyhledávání. Uživatelsky přívětivá je také nabídka základních operátorů AND, NOT, OR, NEAR/5/10/25.

Pokračujme v příkladu s Adamem Smithem. Po základním hledání jsme zjistily, že angličtina 18. století je nad naše síly, proto už nechceme originální texty. Dále nechceme nic o neviditelné ruce trhu, protože tuto teorii si pamatujeme ze střední školy, a naopak nás zajímá Smith ve spojitosti s volným obchodem. Řekněme, že předmětem našeho zájmu budou knihy v angličtině z aktuálního tisíciletí. Vyhledávací dotaz pro naše kritéria může vypadat například takto:

AUTOR, 2021. Obrázek 3 Pokročilé vyhledávání [online] [vid. 2021-03-21]. Dostupné z: https://www.jstor.org/

Poslední dvě pole využijeme, pokud máme detailnější informace a hledáme konkrétní titul. První možností je zadání nazvu knihy, časopisu nebo článku, druhou je jedinečný identifikátor ISBN.

Možnosti vyhledávání pro pokročilé

Pokročilé vyhledávání nám ukázalo, že JSTOR vybízí i začínající uživatele k využívání operátorů. Jakmile si však člověk osvojí základní syntax, může uplatnit efektivní metody i v rámci řádku základního vyhledávání. Díky široké paletě možností dostaneme k dispozici sofistikovanější vyhledávací dotazy.

Co všechno lze tedy využít?

Základní operátory

Uvozovky= pro vyhledání přesné fráze ji vložte do uvozovek (“invisible hand of the market“)

AND = výsledky, která obsahují obě slova (apple AND google)

OR = výsledky, které obsahují jedno nebo obě slova (book OR newspapers)

NOT = výsledky, které neobsahují slovo za operátorem (ink NOT paper)

Závorky = umožňují kombinaci operátorů pro detailní vyhledávání, např. (economy NOT (crisis OR inflation)) vyhledá položky o ekonomice, ale bez zmínek o krizi nebo inflaci

NEAR /5/10/25 = číslice označuje maximální vzdálenost 2 vyhledávaných slov v dokumentu (broom NEAR/10 snitch) (JSTOR 5)

Pokročilé operátory

Podobná slova ~ = přidáním symbolu na konec slova vyhledáme zároveň i obdobně hláskovaná slova, což je vhodné u autorů zahraničních jmen (dostojevksij~) nebo v případě jemných nuancí mezi anglickou a americkou angličtinou (colour~)

Wildcards (? *) = otazník představuje 1 libovolný znak (obdoba žolíka z deskové hry Scrabble) např. wom?n vyhledá woman, women, ale i womqn, pokud se takové slovo v databázi vyskytuje. Na druhou stranu hvězdička je neomezená posloupnost znaků, takže micro* vyhledá microcosmos, mikrobiology, microsoft, microscope atd.

Relevance slov ^ = pomocí ^ upravujeme váhu jednotlivých slov.Dark chocolate^5 znamená, že hledáme informace o hořké čokoládě, ale samotná čokoláda je pro nás pětkrát důležitější (JSTOR 6)

Vyhledávání v polích

Tuto možnost už jsme si vyzkoušeli v pokročilém vyhledáván u Adama Smithe. Rozdílem je, že neklikáme do nabídky polí, ale pro požadované pole píšeme příslušnou zkratku:

au: = autor

ti: = titulek

ca: = popis obrázku

ab: = vyhledá v textu abstraktu

sn: nebo in: = ISSN kód

vo: = číslo svazku

Po osvojení základních zkratek můžeme jít do většího detailu:

la: = vyhledávání pouze konkrétního jazyka (la:eng nebo la:jpn)

ty: = typ dokumentu (ty:fla je dokument v plné délce, ty:brv je recenzí knihy)

cty: = kategorie (cty:chapter pro hledání na úrovni kapitol knih)

(JSTOR 7) (Karlshochschule 2017)

Workspace

Pokud zpracováváme diplomovou práci nebo více odborných prací najednou, uvidíme v nástroji workspace přidanou hodnotu. Pro každý projekt si lze v rámci uživatelského účtu vytvořit složku, do které průběžně ukládáme nalezené použitelné zdroje z JSTORu, ale i různé internetové odkazy mimo naší online knihovnu. Navíc si každou položku můžeme opatřit poznámkami. Při využití zdrojů, nalezených v JSTORu, lze snadno generovat citace pomocí 3 nabízených citačních stylů (MLA, APA a CHICAGO).

AUTOR, 2021. Obrázek 4 Workspace [online]. Dostupné z: jstor.org

Text analyzer

Text analyzer je nástroj stále se nacházející v beta verzi, který již nyní skýtá veliký potenciál. Princip spočívá v nahrání dokumentu, obrázku textu nebo URL odkazu na text. Výsledkem vyhledávání je seznam článků na pravé straně, které se věnují obdobné problematice. Nalezené zdroje můžeme filtrovat na levé straně pomocí odebírání rozpoznaných témat a přidáváním témat vlastních nebo identifikovaných v našem textu.  Příjemným překvapením je možnost modifikace důležitosti jednotlivých témat. Osobně považuji nastavování vah u jednotlivých témat za skvělý bonus. Jednak jsem schopen efektivněji filtrovat velkým množstvím nalezených textů, ale především si sám lépe uvědomím priority témat, což může být pomocnou rukou při tvorbě obsáhlejšího odborného textu.

AUTOR, 2021. Obrázek 5 Text analyzer [online]. Dostupné z: https://www.jstor.org/analyze/

Závěr

JSTOR je respektovaným zdrojem, který v mnoha ohledech předčí běžné odborné knihovny.  Studenti zde naleznou zdroje vhodné pro seminární i diplomové práce a odborníci dostatek relevantních informací pro rozšiřování svých obzorů. Veřejnost zase ocení bezplatný přístup k značnému množství odborných článků z širokého spektra oborů. Hlavními přednostmi JSTORu jsou fulltextové vyhledávání a možnost detailního filtrování výsledků. JSTOR se díky všemu výše uvedenému vyvinul ve významný akademický informační zdroj, který jde začátečníkům naproti prostřednictvím uživatelské přívětivosti.

Ohledně využití pro competitive intelligence je překážkou, již dříve zmiňovaná, „pohyblivá zeď“, která posouvá zveřejnění většiny časopisů a e-knih o několik let. Proto není JSTOR vhodný pro vyhledávání nejnovějších událostí ve světě. JSTOR, si ale místo v CI stále najde, zejména v poskytování relevantních informací staršího data, které poslouží k vysvětlení dnešní situace nebo byly prvotním impulsem pro dlouhodobý trend.

Seznam zdrojů:

AUTOR, 2021a. Obrázek 1 Úvodní stránka [online]. Dostupné z: jstor.org

AUTOR, 2021b. Obrázek 2 Výsledek vyhledávání [online]. Dostupné z: https://www.jstor.org/action/doBasicSearch?Query=au%3A%28%22adam+smith%22%29&acc=on&wc=on&fc=off&group=none&refreqid=search%3A1ce16c88722c9a6c7be3480f0c8b1493

AUTOR, 2021c. Obrázek 3 Pokročilé vyhledávání [online] [vid. 2021-03-21]. Dostupné z: jstor.org

AUTOR, 2021d. Obrázek 4 Workspace [online]. Dostupné z: jstor.org

AUTOR, 2021e. Obrázek 5 Text analyzer [online]. Dostupné z: https://www.jstor.org/analyze/

JSTOR 1, nedatováno. Mission and history. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/mission-history/

JSTOR 2, nedatováno. Journals. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/librarians/journals/

JSTOR 3, nedatováno. Books. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/librarians/books/

JSTOR 4, nedatováno. Get JSTOR. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/get-jstor/

JSTOR 5, nedatováno. Searching: Boolean Operators. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115004733187-Searching-Boolean-Operators

JSTOR 6, nedatováno. Searching: Truncation, Wildcards and Proximity. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115012261448-Searching-Truncation-Wildcards-and-Proximity

JSTOR 7, nedatováno. Searching: Using Fields. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115004732567-Searching-Using-Fields

KARLSHOCHSCHULE, 2017. How to Search JSTOR [online]. 18. červenec 2017. Dostupné z: https://karlshochschule.de/uploads/tx_txkhshelper/user_upload/How_to_Search_JSTOR.pdf

Loc.gov: Library of Congress

0

Tento článek pojednává o informačním zdroji, který umožňuje vyhledávat ve sbírkách největší světové knihovny a jejím digitalizovaném archivu a umožňuje vyhledávání a přístupu k dalším publikacím, které se nacházejí ve sbírkách spolupracujících institucí.

Informační zdroj Library of Congress

Knihovna Kongresu (Library of Congress) je největší knihovnou světa s více než 170 mil. kusů publikací ve sbírce (Library of Congress, 2021a) a s ročním růstem okolo 2 mil. publikací. Knihovna je Národní knihovnou USA. Slouží tak jako studovna a badatelna. Nachází se ve Washingtonu D.C. v několika hlavních budovách. Další pobočky má po celých Spojených státech a jiných státech světa. (Billington, 2021)

Tento informační zdroj slouží k přístupu ke službám knihovny (vyhledávání, objednávání služeb) a k přístupu k jejímu digitalizovanému obsahu. Obsah knihovny je přístupné zdarma. (Library of Congress, 2021b)

Vyhledávání v Library of Congress

Vyhledávání v katalogu knihovny probíhá několika způsoby. Nejednoduší je zadávání celého vyhledávaného výrazu do vyhledávací řádky. Tento dotaz ovšem bude široky a bude obsahovat také irrelevantní dotazy. Dotaz se dá filtrovat dle typu publikace. Vyhledávání lze vidět na obrázku č. 1.

Obrázek 1: Vyhledávání publikace. (Library of Congress, 2021c)

Vyhledávaný obsah se dá filtrovat, ale nastavování relevantní oblastí nelze nastavit na úrovni dotazů. Filtrování lze vidět na obrázku č. 2.

Obrázek 2: Filtrování při vyhledávání. (Library of Congress, 2021d)

U elektronických a digitalizovaných dokumentů lze jejich obsah zobrazit přímo na monitoru u ostatních periodik dojde k přesměrování na katalog knihovny. U této možnosti (katalog knihovny) jsou rozšířené možnosti vyhledávání a k jejich popsání dojde níže.

Při zobrazení jsou uvedeny informace o publikaci. Jde např. o její název, vydavatele, autora, datum vydání, věcné poznámky k publikaci, či počet stran.

Základní vyhledávání

Ostatní vyhledávání je možné v online katalogu knihovny, ten je přístupný následovně na obrázku č. 3, popř. přes odkaz: https://catalog.loc.gov/.

Obrázek 3: Vyhledávání v katalogu knihovny. (Library of Congress, 2021c)

Zde se přistupuje k vyhledávání následovně (modře základní, červeně pokročilý, zeleně klíčová slova) a lze to vidět na obrázku č. 4.

Obrázek 4: Výběr možnosti vyhledávání. (Library of Congress, 2021e)

Všechny vyhledávání umožnují vyhledávat přes specifikované kategorie. Základní vyhledávání je umožněno přes následující kategorie, které jsou uvedeny níže a je dostupné přes odkaz https://catalog.loc.gov/vwebv/searchBrowse. Ukázku obrazovky pro základní vyhledávání lze vidět na obrázku č. 5.

Obrázek 5: Základní vyhledávání (Library of Congress, 2021f)
  • Titles: Název publikace
  • Authors/creators: Autor, vydavatel publikace. Obsahuje dvojí způsob hledání:
    • obsahuje zadaný řetězec
    • začíná hledaným řetězcem
  • Subjects: Hledaná oblast publikace. Obsahuje dvojí způsob hledání:
    • obsahuje zadaný řetězec
    • začíná hledaným řetězcem
  • Names/titles: Hledaný výraz, jméno v textu. Obsahuje dvojí způsob hledání:
    • obsahuje zadaný řetězec
    • začíná hledaným řetězcem
  • Series/uniform titles: Hledaný název řady publikace
  • CALL NUMBERS: Umístění publikace
  • LCCN: Identifikátor publikace

V případech, kde vyhledáváme výskyt daného řetězce v textu, pak lze použít tyto zástupné symboly.

  • % – místo tohoto znaku může být jakýkoliv jeden znak,
  • ? – místo tohoto znaku může být libovolné množství znaků.

Hledaný výraz lze také filtrovat dle:

  • Roku publikace,
  • řazení publikace do oblastí (dětské, evropské, americké apod.),
  • umístění publikace (v jaké knihovně se nachází),
  • typu publikace (kniha, film),
  • jazyku,
  • počtu záznamů na stránce.

Pokročilé vyhledávání

Další možností je pokročilé vyhledávání, které umožňuje spojovat jednotlivé zadané výrazy pomocí logických spojek. Vyhledávaní je přístupné zde: https://catalog.loc.gov/vwebv/searchAdvanced. Popis logických spojek je následující:

  • AND: Výsledek obsahuje oba zadané výrazy
  • OR: Výsledek obsahuje alespoň jeden zadaný výraz
  • NOT: Výsledek neobsahuje zadaný výraz

Vyhledávání probíhá pomocí podobných kategorií. Jejich počet je ovšem větší. Také zde funguje filtrování výsledků a zástupné symboly. Podobu pokročilého vyhledávání lze vidět na obrázku č. 6.

Obrázek 6: Pokročilé vyhledávání (Library of Congress, 2021g)

Vyhledávání dle klíčových slov

Poslední možností je vyhledávaní dle klíčových slov. Toto vyhledávání je přístupné zde: https://catalog.loc.gov/vwebv/searchKeyword.

Lze vyhledávat dle názvu, autora, oblasti, popř. si vybrat jakékoliv z definovaných kategorií (pod položkou EXPERT) na tomto seznamu: https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_name.html. U této kategorie lze také používat logické spojky. U všech kategorií funguje filtrování výsledků.

Ukázka vyhledávání v uložišti

Pro zkoušku vyhledáme publikace, která má v názvu Abraham Lincoln. Vyhledáváme tedy dle kategorie TITLE. První publikace se věnuje armádní kariéře Abrahama Lincolna. Je tedy relevantní k danému hledanému výrazu. To lze vidět na obrázku č. 7.

Obrázek 7: Ukázka vyhledávání (Library of Congress, 2021h)

Po otevření se nám zobrazí informace o publikace. Je zde uveden autor publikace (včetně roků, kdy žil), název publikace, typ publikace, nakladatel a rok vydání. Dále je zde možnost o tuto knihu zažádat (ve fyzické podobě) a zjistit, kde se kniha nachází. To lze vidět na obrázku č. 8.

Obrázek 8: Náhled informací o knize (Library of Congress, 2021i)

Mimo tyto informace jsou zde popsány informace o knize (počet stran, rozměry, materiál), ID v rámci knihovny, sekce, kde se publikace nachází a v jakých kategoriích je kniha řazena. Pro knihy, zde moc dodatečných informací není. Pro filmové publikace je jich ovšem více. Jsou zde např. uvedeni herci a všechny osoby spolupracující na filmu. Dále jsou zde i poznámky k obsahu filmu, co vše mimo film obsahuje (např. reklamy apod).

Autory publikací, popř. herce lze vyhledávat pomocí hyperlinkových odkazů, které přesměrují uživatele do vyhledávání dle dané kategorie. To lze např. vidět níže na obrázku č. 9.

Obrázek 9: Vyhledávání autora pomocí hyperlinkového odkazu (Library of Congress, 2021j)

Vyhledávání v kolekcích dokumentů

Knihovna umožňuje také vyhledávat v kolekcích dokumentů (např. soukromou korespondenci osob apod), popř. hledat jiné poskytovatele, kteří mají dokumenty, které se věnují dané oblasti, popř. obsahuje e-dokumenty (knihy, deníky). Ty jsou dostupné přes katalog knihovny na obrázku č. 10 (modře interní kolekce, zeleně externí kolekce a e-dokumenty).

Obrázek 10: Vyhledávání v kolekcích dokumentů (Library of Congress, 2021e)

V interních dokumentech se dá vyhledávat dle zadaného výrazu, popř. zobrazit všechny kolekce dle dané kategorie. Vyhledávání lze vidět na obrázku č. 11.

Obrázek 11: Vyhledávání v interních kolekcích (Library of Congress, 2021k)

Při rozkliknutí výsledků se zobrazí informace o kolekci, kde se fyzicky nachází a co je jejím obsahem. Každý dokument je zde také popsaný.

Vyhledávání na externí kolekce probíhá výběrem oblasti, popř. zadáním do vyhledávání. Externí vyhledávání lze vidět na obrázku č. 12.

Obrázek 12: Vyhledávání v externích kolekcích (Library of Congress, 2021l)

Zde se po rozkliknutí zobrazí seznam externích poskytovatelů dat, které mají o dané oblasti potřebné data. U každého je také popis, který vysvětluje, jaké informace se zde nacházejí a zda je přístupný zdarma, popř. za poplatek. To lze vidět na obrázku č. 13.

Obrázek 13: Detail externí kolekce (Library of Congress, 2021l)

Po přepnutí na e-dokumenty se po rozkliknutí zobrazí informace o daném dokumentu, včetně informací, zda je přístupný a odkaz na externí stránky, kde je umístěn

Závěr

Informační zdroj loc.gov je přístupovým prostředí do sbírek Knihovny Kongresu. Z tohoto zdroje lze tak přistupovat k největším světovým sbírkám publikací o velikosti přesahující 170 mil. kusů. Umožňuje vyhledávat jak fyzické kusy, které si lze v knihovně zapůjčit, tak i v digitalizovaném archivu, včetně multimediálních záznamů. Mimo vlastní sbírky knihovny kongresu umožňuje vyhledávat také v dalších informačních zdrojích mimo vlastní sbírky knihovny.

V práci je popsán způsob práce s tímto informačním zdrojem z hlediska vyhledávání.

Zdroje

BILLINGTON, James H., 2021. Library of Congress. In britannica.com [online]. Chicago: Encyclopædia Britannica, Inc., 2021. [cit. 2021-03-23]. Dostupné z: https://www.britannica.com/topic/Library-of-Congress

LIBRARY OF CONGRESS, 2021a. General Information. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/about/general-information/

LIBRARY OF CONGRESS, 2021b. Frequently Asked Questions. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/about/frequently-asked-questions/

LIBRARY OF CONGRESS, 2021c. LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/

LIBRARY OF CONGRESS, 2021d. Search in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/search/?in=&q=&new=true&st=

LIBRARY OF CONGRESS, 2021e. Search option in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/

LIBRARY OF CONGRESS, 2021f. Browse in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchBrowse

LIBRARY OF CONGRESS, 2021g. Advance search in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchAdvanced

LIBRARY OF CONGRESS, 2021h. abraham lincoln. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/search?searchArg=abraham+lincoln&searchCode=TKEY%5E*&searchType=1&limitTo=none&fromYear=&toYear=&limitTo=LOCA%3Dall&limitTo=PLAC%3Dall&limitTo=TYPE%3Dall&limitTo=LANG%3Dall&recCount=25

LIBRARY OF CONGRESS, 2021i. The military life of Abraham Lincoln, Commander in Chief. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/holdingsInfo?searchId=6212&recCount=25&recPointer=0&bibId=290817

LIBRARY OF CONGRESS, 2021j. Dupuy, Trevor N.. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/search?searchArg=Dupuy,%20Trevor%20N.%20(Trevor%20Nevitt),%201916-1995.&searchCode=NAME%2B&searchType=1&recCount=25

LIBRARY OF CONGRESS, 2021k. Search Finding Aids. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://findingaids.loc.gov/

LIBRARY OF CONGRESS, 2021l. Library of Congress E-Resources Online Catalog. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://eresources.loc.gov/

LIBRARY OF CONGRESS, 2021m. Library of Congress E-Resources Online Catalog: Art and Architecture. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://eresources.loc.gov/search~S9/m?SEARCH=Art+and+Architecture

LIBRARY OF CONGRESS, 2021n. Úvodní snímek: George Washington. In loc.gov. [online]. Washignton D.C.:  Library of Congress, 2021. [cit. 2021-05-02]. Dostupné z: https://www.loc.gov/resource/cph.3a09915

Nástroj Doing Business – analyzujte, kde jsou nejlepší podmínky pro podnikání

0

Základní informace o společnosti

Doing Business je projekt založen roku 2002, který zkoumáním několika metrik porovnává prostředí podnikové regulace v téměř 190 ekonomikách s cílem poskytnout akademickým pracovníkům, novinářům, zájemcům v oblasti ekonomiky a dalším informace o tom, který stát přináší nejpřijatelnější prostředí pro podnikání. Doing Business se nezaměřuje pouze na zkoumání podnikové regulace na úrovni států, ale provádí také studie různých měst a regionů ve vybraných zemích. Uživatel může porovnávat nejen státy světa, ale také některá jejich města. Lze tedy získat povědomí o tom, které město je z hlediska snadnosti podnikání optimální. Dalším záměrem tohoto projektu je vzbudit soutěživost jednotlivých ekonomik o vytvoření co nejadekvátnějších regulací. [1]

Indikátory

První zveřejněná studie Doing Business byla již rok po jeho založení, tedy v roce 2003. Studie zkoumala snadnost podnikání u 133 ekonomik pomocí 5 identifikátorů. Od této doby došlo k značnému pokroku, kdy letošní studie zahrnuje 190 ekonomik, které jsou měřeny pomocí 11 indikátorů. [1]

Seznam těchto indikátorů, včetně popisu, co je u nich měřeno obsahuje tabulka č.1., která je volně dostupná na stránkách Doing Business v sekci About.

Tabulka 1 Indikátory a co je u nich měřeno [2]

Indikátory

Co je měřeno

Starting a business

Postupy, čas, náklady, minimální kapitál pro založení s.r.o. pro muže a ženy

Dealing with construction permits

Postupy, čas a náklady na vyřízení všech formalit k vybudování skladu, mechanismy kontroly kvality a bezpečnosti v systému stavebního povolení

Getting electricity

Postupy, čas, náklady na připojení k elektrické síti, spolehlivost dodávky a transparentnost tarifů dodavatelů elektřiny

Registering property

Postupy, čas, náklady na převod nemovitostí. Kvalita systému katastrálního úřadu pro muže a ženy

Getting credit

Zákony o movitých věcech a úvěrové informační systémy

Protecting minority investors

Práva menšinových akcionářů v transakcích se spřízněnými stranami a ve správě a řízení společností

Paying taxes

Platby, čas a celková daň a sazba příspěvku, aby firma splňovala všechny daňové předpisy i procesy následné archivace

Trading across borders

Čas a náklady na export produktů s komparativní výhodou a na import zboží

Enforcing contracts

Čas a náklady na vyřešení obchodního sporu a kvalita soudních procesů pro muže a ženy

Resolving insolvency

Čas, náklady, výsledek a míra vymáhání obchodní neschopnosti a síla právního rámce pro platební neschopnost

Employing workers*

Flexibilita regulace zaměstnanosti

Contracting with the government*

Postupy, čas na účasti a získání veřejných zakázek. Regulační rámec spojený se zadáváním veřejných zakázek

* Nejsou součástí hodnocení v Doing Business 2020.

Získávání dat

Data, která společnost Doing Business využívá pro tvorby studií, jsou získávána ze 4 základních pramenů. Patří zde zákony a předpisy jednotlivých států, respondenti společnosti, vláda a zaměstnanci World Bank Group. Společnost uvádí, že má více než 48 tisíc profesionálů ve 190 ekonomikách. Kolekce dat následně probíhá pomocí písemné či ústní komunikace, dotazníkového šetření, vlastní návštěvou apod. [3] Celý proces, včetně časového harmonogramu se nachází na obrázku č.1.

Jak Doing Business sbírá a ověřuje data
Obrázek 1 Jak Doing Business sbírá a ověřuje data [4]

Využití

Doing Business představuje veřejně dostupný nástroj, jenž najde uplatnění v širokém spektru oblastí. Od roku 2003 bylo výzkumnými pracovníky napsáno tisíce článku opírající se o data, které poskytl tento nástroj. Dále kromě novinářů, lidí zajímající se o ekonomiku a mnoho dalších, je možno najít uplatnění i v oblasti zákonodárné, kdy poslanci/vláda mohou využít data pro objevení nedostatků země ve které působí a navrhovat efektivní zákony v oblasti podnikové regulace, které mohou vytvořit pro občany optimální prostředí pro podnikání a posunout ekonomiku země dopředu. [3]

První pohled na webové prostředí

Web společnosti Doing Business poskytuje uživatelům 7 jazykových mutací jako je angličtina, španělština, francouzština, portugalština, ruština, čínština a arabština. Při prvním pohledu na web uživatel hned vidí datový vyhledávač a přehled hlavních zjištění, kterých dosáhla společnost při tvorbě reportu „Doing Business 2020“. Za zmínku stojí například informace, že Saúdská Arábie, Jordánsko, Togo, Bahrajn, Tádžikistán, Pákistán, Kuvajt, Čína, Indie a Nigérie vykazují markantní zlepšení oproti minulých let. [5] Co se týče datového vyhledávače, jehož vzhled demonstruje obrázek č.2, ten nabízí uživateli možnost filtrace pomocí ekonomiky nebo indikátorů.

Obrázek 2 Datový vyhledávač na domovské obrazovce[5]
Obrázek 2 Datový vyhledávač na domovské obrazovce[5]

V případe filtrování podle ekonomiky (v tomto případě byla zvolena Česká republika) je uživatel přesměrován na záložku „Data“, kde mu jsou zobrazeny výsledky studie pro danou zemi. Uživatel se dozví, jaké celkové skóre země obdržela a na jaké pozici v celkovém žebříčku všech ekonomik se nachází.

Obrázek 3 Hodnocení České republiky [6]
Obrázek 3 Hodnocení České republiky [6]

Níže na stránce se nachází přehled, jak dopadlo hodnocení pro jednotlivé oblasti v rámci zvolené země. V případě České republiky může uživatel vidět, že ze všech zkoumaných ekonomik nabízí ČR nejlepší podmínky pro „Trading across Borders“. Na druhou stranu byla země nejhůř hodnocena v oblasti „Starting a Business“.

Obrázek 4 Výsledky pro jednotlivé oblasti [6]
Obrázek 4 Výsledky pro jednotlivé oblasti [6]

Závěr přehledu tvoří interaktivní tabulka, kde se uživatel kliknutím na jednu z oblastní dozví, co vše bylo v rámci dané oblasti zkoumáno, včetně výsledků zkoumání. Vzhled tabulky pro oblast „Trading Across Boarders“ demonstuje obrázek níže.

Obrázek 5 Vzhled interaktivní tabulky [6]
Obrázek 5 Vzhled interaktivní tabulky [6]

V případě že by se uživateli o dané zemi chtěl dozvědět více než je zobrazeno na této stránce, je mu umožněno stáhnout si report v podobě PDF souboru, který obsahuje kompletní výsledky studie pro danou zemi včetně detailnějšího popisu jednotlivých oblastí. Pro zajímavost je vhodné zmínit, že v případě České republiky(odkaz) má report pro rok 2020 rozsah 69 stránek. Jestliže se nechce uživatel omezovat pouze na jeden stát a zajímají ho kompletní reporty studie „Doing Business“ zahrnující všech 190 ekonomik, stačí pouze v navigační části webu přejí na stránku „Reports“, kde jsou pro uživatele připravené PDF reporty již od vydaní pro rok 2004. Volba reportu probíhá pomocí rozbalovacího seznamu.

Obrázek 6 Rozbalovací seznam [7]
Obrázek 6 Rozbalovací seznam [7]

Rankings

Další možnosti stránky doingbusiness.org přináší záložka „Rankings“, kde se nachází tabulka obsahující všech 190 ekonomik a jejich hodnocení. Uživatel si zde může vybrat zda chce vidět hodnocení v podobě rankingu nebo skóre. Obě dvě hodnoty reflektují úspěšnost ekonomiky v oblasti snadnosti podnikání, akorát na jinačí škále. V případě rankingu nabývá hodnocení hodnot od 1 do 190, kdy stát držící ranking 1 představuje ekonomiku poskytující nejpříznivější podmínky z hlediska regulací pro podnikání. Jedná se tedy o určitý žebříček. Jak již je ukázáno na obrázku č.3, celkové umístění ČR je na 41. místě, což muže být poněkud uspokojující. Pro zájemce zde Doing Business zanechává link na PDF soubor s názvem „ease of doing business rankings and the ease of doing business scores are calculated“, kde je možné na 10 stránkách se dočíst jak ranking a skóre fungují a jak jsou vypočítávány. [8]

Pro možnost filtrování dat v tabulce na stránce jsou zde připraveny dva rozbalovací seznamy. První rozbalovací seznam pojednává o regionech a druhý o platových třídách (viz. obrázky níže).

Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]
Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]

Výslednou tabulku lze také stáhnout ve formátu .xlsx či PDF. V případě nevyužití rozbalovacího seznamu se na stránce nachází tabulka obsahujících všech 190 záznamů. Například z přiloženého obrázku č.8 lze vyčíst, že nejpřijatelnější prostředí pro podníkání z pohledu státní regulací je Nový Zéland.

Obrázek 8 Nejlépe hodnocené ekonomiky [8]
Obrázek 8 Nejlépe hodnocené ekonomiky [8]

Historical Data Sets and Trends Data

Záložka „Historical Data Sets and Trends Data“ umožňuje uživateli vygenerovat si dataset na základě jeho preferencí z dat, které Doing Business má. Tvorba zde probíhá ve 3 krocích, kdy v prvním si uživatel vybere ekonomiky, které chce v datasetu mít. Uživatel si může vyklikat jednotlivé ekonomiky nebo využít předdefinovaných skupin tvořených buď podle regionů, nebo platových skupin.

Obrázek 9 Vzhled filtru pro vytváření datasetu [9]
Obrázek 9 Vzhled filtru pro vytváření datasetu [9]

V kroku č.2 dochází k volbě oblastí – Starting a Business, Getting Credit, Trading across Borders apod. Poslední krok nabízí možnost zvolit si zda bude dataset obsahovat data pouze z Doing Business 2020, či i starší. Výsledek se na stránce zobrazí ve formě interaktivní tabulky s možnosti stažení ve formátu .xlsx či pdf.

Law Library 

Záložka s názvem „Law Library“ se představuje jako největší online sbírka obchodních zákonů a předpisů. [10] Jedná se o velice povedený nástroj, kdy pomocí filtrů je uživatel schopen si vyhledat zákony a předpisy ve 190 ekonomikách. Na výběr je zde od administrativních až po daňové zákony. Výsledek se zobrazí ve formě url linku odkazujících na relevantní zdroj. V případě bankovního práva České republiky se jedná o webové stránky ČNB.

Obrázek 10 Bankovní a daňové zákony pro ČR [10]
Obrázek 10 Bankovní a daňové zákony pro ČR [10]

Business Reforms

Poslední zajímavý nastroj přináší záložka s názvem „Business Reforms“, kde pomocí selekce ekonomiky, oblasti či regionu se uživatel může dozvědět, jaké se v dané lokalitě vytvořily reformy pro ulehčení či ztížení podnikaní. V případě, pro tuto práci zvolené, České republiky se zde vyskytuje poslední záznam z roku 2018, kde ČR provedla zlepšení v oblasti „Starting Business“ a to snížením poplatků pro založení společnosti s ručeným omezeným. Naopak ke ztížení podnikaní došlo v oblasti placení daní, kde zavedením nových požadavků na vyplnění přiznání k DPH došlo ke zkomplikování procesu placení daní. [11]

Obrázek 11 Business reformy pro ČR [11]
Obrázek 11 Business reformy pro ČR [11]

Závěr

Doing Businnes představuje projekt založený v roce 2002, který provádí studie v celkem 190 ekonomikách napříč světem. Cílem projektu je zmapovat oblast podnikové regulace v jednotlivých ekonomikách a určit, který stát přináší nejpřijatelnější prostředí pro podnikání. Výsledky jejich studie následně publikují na svých stránkách s názvem “Doing Business”, kde jsou volně ke stažení v PDF formátu. Mimo toho se na stránkách společnosti nachází cela řada užitečných nástrojů. Za zmínku stojí třeba možnost stažení si datasetu Doing Business, nahlédnout do největší online sbírky obchodních zákonů a mnoho dalších. Autor doporučuje všem čtenářům si webovou stránku společnosti Doing Business prohlédnout, jelikož se jedná o velice zajímavý a přínosný projekt nacházející uplatnění v mnoha oblastech od novinařiny až po politiku.

Zdroje

[1] About us. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/about-us

[2] What Doing Business measures—12 areas of business regulation. In: About Doing Business: Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[3] About Doing Business. Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[4] How Doing Business collects and verifies the data. In: About Doing Business: Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[5] DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/doingbusiness

[6] Ease of Doing Business in Czech Republic. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/data/exploreeconomies/czech-republic#DB_tab

[7] Reports. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/reports/global-reports/doing-business-2020

[8] Rankings. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/rankings

[9] Historical Data Sets and Trends Data. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/custom-query

[10] Law Library. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/law-library

[11] Business Reforms in Czech Republic. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/reforms/overview/economy/czech-republic

Seznam obrázků

Obrázek 1 Jak Doing Business sbírá a ověřuje data [4]

Obrázek 2 Datový vyhledávač na domovské obrazovce [5]

Obrázek 3 Hodnocení České republiky [6]

Obrázek 4 Výsledky pro jednotlivé oblasti [6]

Obrázek 5 Vzhled interaktivní tabulky [6]

Obrázek 6 Rozbalovací seznam [7]

Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]

Obrázek 8 Nejlépe hodnocené ekonomiky [8]

Obrázek 9 Vzhled filtru pro vytváření datasetu [9]

Obrázek 10 Bankovní a daňové zákony pro ČR [10]

Obrázek 11 Business reformy pro ČR [11]

CC Search – k stovkám milionů fotografií z celého světa

0

Co znamená Creative Commons Search?

Zkratka CC reprezentuje název neziskové organizace Creative Commons, která se zabývá licencováním multimediálního obsahu. Zároveň do jejího portfolia spadá již zmíněný CC Search, což je nástroj, který umožňuje snadno objevovat a používat otevřeně licencovaná a veřejně dostupná autorská díla pomocí snadného vyhledávání. CC Search prohledává více než 300 milionů obrázků z otevřených API a datové sady Common Crawl. Jde nad rámec jednoduchého vyhledávání a agreguje výsledky napříč několika veřejnými úložišti (Flickr, Europeana,… ) do jednoho souhrnného katalogu. V současné době CC Search plně podporuje prohledávání obrázků, ale plánují plně implementovat vyhledávání napříč dalšími typy médií, jako jsou otevřené texty, audio a video. Tento „další“ multimediální obsah momentálně běží v testovací verzi. Obsah z těchto platforem lze prohledávat pomocí CC Search a sdílet na webu díky licencím CC.

Ukázka procházených zdrojů
 Obrázek: Ukázka log procházených informačních zdrojů s licencovaným obsahem dle CC. [Zdroj: creativecommons.org]

Typy licencí Creative Commons

Každé dílo, ať už jde o obrázek, fotografii, hudbu, odborný i prozaický, nebo i poetický text, má svého autora a ten vlastní k dílu autorská práva. Ta obsahují mix práv a povinností spjatých s daným dílem a stanovují to, jak se s ním smí zacházet. Autorskoprávní nástroje a licence Creative Commons vytvářejí rovnováhu v rámci tradičního nastavení „všechna práva vyhrazena“, které jinak automaticky autorské právo zajišťuje. Nástroje Creative Commons nabízejí každému, od jednotlivých autorů až po velké společnosti jednoduchý standardizovaný způsob, jak umožnit ostatním užívat jejich dílo. Přehled jednotlivých licencí s ukázkou práv a povinností k nim spjatých je  uveden v následující tabulce. 

Tabulka znázorňující přehled licencí a práv + povinností
Tabulka: Znázorňující přehled CC licencí a jejich práv + povinností [Zdroj: web.natur.cuni.cz]

 


 

Možnosti vyhledávání v CC Search

Na první pohled při příchodu na platformu CC Search, která se nachází na adrese https://search.creativecommons.org se uživateli objeví nápadně podobné rozhraní připomínající jinou vyhledávací platformu Google. Uprostřed obrazovky se tyčí velký Search Bar umožňující zadání klíčových slov pro vyhledávání v rámci obsahu, který je licencovaný pomocí CC licencí. Po kliknutí na tlačítko Search se uživateli zobrazí, stejně jako u Googlu katalog výsledků, které se vztahují ke klíčovým slovům, jenž uživatel zadal k vyhledání. 

CCSearch Úvodní stránka
Obrázek: Úvodní stránka při příchodu na search.creativecommons.org  [Zdroj: Vlastní zpracování]

Syntaxe vyhledávání

Stejně jako již zmíněný Google, tak i CC Search umožňuje uživatelům konkretizovat jejich vyhledávání pomocí speciálních symbolů nebo slov, které slouží k bližšímu upřesnění vámi hledaných spojení. 

Vyhledávání s přesnou shodou

Pro vyhledávání slova nebo fráze je nutné hledaný termín dát do uvozovek. Například pro doslovné vyhledávání tvrzení Empire State building je potřeba do Search Baru zadat „Empire State Building“, tím dáváme najevo, že nás zajímá jen přesná shoda, nikoliv částečná. 

Kombinování vyhledávaných termínů 

Pokud by uživatel potřeboval různě kombinovat vyhledávané termíny, tak k tomu slouží operátory, které umožňují vykonávat komplexnější dotazy. Nejprve budou představeny samotné operátory a poté ke každému bude uveden příklad využití a vysvětlení jak funguje. 

  • +   Operátor značící logickou operaci AND 
  • |    Operátor značící logickou operaci OR
  • –    Operátor negující jeden token/termín
  • *   Operátor, který na konci hledaného výrazu značí tzv. prefix query
  • ()   Operátor pro signalizaci priority
  • ~N Operátor uvádějící se na konci slova sloužící k nastavení Fuzzy distance výrazu

Příklady vyhledávání:

dog+cat  -> Tento dotaz vyhledá výsledky, na kterých je jak pes, tak kočka.

dog|cat -> Tento dotaz by vyhledal výsledky, na kterých je buď pec nebo kočka, ale nemusely by tam nutně být oba.

dog -buldog -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale vynechal by ty na nich je vyobrazený buldok. Využili jsme daný operátor – k vyloučení buldočího plemene z výsledků vyhledávání psů. 

net* -> Tento dotaz by vyhledal výsledky pro slova, které začínají na net a hvězdička poté značí, že může následovat cokoliv. Jedná se o takzvaný Wildcard operátor. Takže ve výsledcích by se mohla objevit slova jako: Netflix, Netherlends, network, a spousta dalších. 

dogs + (labrador|chivava) -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale konkrétně čivava nebo labrador. Závorky slouží k určení priority dotazu nebo ke kombinování složitějších dotazů.  

theatre~1 -> Tento dotaz by vyhledal výsledky, které se mohou lišit o proti hledanému výrazu o jeden znak. Výsledek by tedy mohl obsahovat slova, která mají jiný pravopis jako třeba Theater místo Theatre. Tento jev se odborně nazývá fuzzy logic/fuzziness.

 

Meta Search

Meta vyhledávač (známý také jako více vláknový modul) je vyhledávací nástroj, který odesílá váš dotaz současně několika vyhledávačům (Search Engine), webovým adresářům (WD) a někdy i takzvanému Invisible (Deep) Webu, shromažďování online informací neindexovaných tradičními vyhledávači. V tomto případě se vyhledávač snaží najít veškery obsah indexovaný licencemi Creative Commons. CC Search následně z posbíraných pozitivních výsledků hledání vytvoří katalog, který se uživateli zobrazí jako výsledek hledání, ale tato funkcionalita zatím funguje pouze pro obrázky. Audio a Video má na stránce zastoupení v záložkách, ale hledání momentálně nabízí jen odkazy na zdroje obsahující daný obsah pod licencemi CC, což je názorně předvedeno v přiložených obrázcích. 


 

Filtrování a přehled výsledků

Výsledný agregovaný katalog obrázků pro audio a video tato funkcionalita zatím nefugnuje, lze dále selektovat finální výběr obrázků, na základě intuitivních filtrů, které CC Search nabízí v levém menu. K dispozici jsou uživateli filtry podle:

  • Použití obrázku
  • Typu CC licence obrázku
  • Zdroje obrázku
  • Typu obrázku
  • Formátu obrázku
  • Poměru stran 
  • Velikosti obrázku
  • Autora

Filtry fungují velmi intuitivně jako na většině eshopů a běžných stránkách, kdy uživatel vybere jednotlivé filtry, o které má zájem a ty mu automaticky překreslují výsledný katalog, aby splňoval uživatelem stanovené požadavky. Pokud by si přál odstranit nějaký konkrétní filtr, tak jej stačí odkliknout nebo zrušit křížkem, případně je zde možnost vyčistit všechny filtry, která zruší veškeré nastavené filtrování výsledků.

 


 

Zdroje:

  1. https://web.natur.cuni.cz/student/creative-commons-aneb-co-je-na-internetu-volne-k-pouziti
  2. https://creativecommons.org/about/platform/
  3. https://search.creativecommons.org/meta-search
  4. https://search.creativecommons.org/
  5. https://creativecommons.org/licenses/?lang=cs
  6. https://search.creativecommons.org/search-help
  7. https://www.llrx.com/2002/09/features-the-meta-search-engines-a-web-searchers-best-friends

Anopress: Inteligentní monitoring médií

0
social-media

Úvod

Informace nás dnes zahlcují ze všech stran, ať už z tisku, rozhlasu, internetu anebo sociálních sítí. Díky neustálému růstu a rychlosti médií, je tak velmi obtížně držet krok s dobou.

Jaké jsou nejnovější články na téma, které vás zajímá? Kolikrát se letos psalo o vaší firmě v médiích a kolikrát o konkurentech? Čemu se média nyní věnuji? Místo trávení velkého množství času s vyhledávači ve snaze najít odpovědi na tyto otázky, máme nyní možnost využít informační zdroje, které nám s těmito problémy snadno pomohou.

 Základní rozhraní systému Anopress. [Zdroj: autor]

Obecné informace o databázi Anopress

Anopress představuje databázi českých médii, která mimo plných textů z českých noviny a časopiseckých článků, obsahuje doslovné přepisy televizních a rozhlasových relací, nebo například zprávy z internetových serverů. V roce 2019 byla databáze také rozšířena o sociální média, konkrétně Facebook, Instagram, Twitter, Youtube a archivně tištěných publikací sahá až do roku 1996 a obsahuje i tituly které již dávno nevychází. U televizních a rozhlasových relací je archiv datován do roku 1998. V současné době je monitorováno 5183 zdrojů z České republiky a Slovenska.

K aktualizaci článků dochází u většiny typů médií (televize, rozhlas, internet, sociální média) v průběhu celého dne, denní tisk je aktualizován každý den v 6 hodin ráno. Denně do databáze přibývá zhruba 300 tisíc nových záznamů (https://www.anopress.cz, 2021 a Masarykova univerzita, 2020)

Databázi spravuje od roku 2020 společnost NEWTON Media, a. s. , která v České republice působí od roku 1995. Společnost Anopress IT, a.s, která databázi založila, zanikla fúzí se společností NEWTON Media k 31. 12. 2019. (Wikipedie: Otevřená encyklopedie, 2020; https://www.mediar.cz/anopress-splyne-s-materskou-firmou-newton-media/, 2. 12. 2019)

Vyhledávání


Výběr období 
– Tento filtr nám umožňuje omezit období, kdy byly dané články vydané či zpracované. A to od hodiny až po dny, týdny, měsíce anebo roky.Pro základní vyhledávání sloučí vyhledávací pole, jež se nachází v horní části úvodní obrazovky. Dotaz může tvořit jedno slovo nebo více slov za sebou, v druhém případě pak výsledkem budou články, které obsahují celé toto sousloví. Veškeré hledané výrazy se automaticky skloňují, vyhledavač pak nebere v potaz velikost písmen, avšak je nutné zadávat českou diakritiku. Anopress pak také nabízí mnoho dalších kritérií, které při vyhledávání můžete využít. Tyto kritéria se nachází pod vyhledávacím oknem. Mezi tyto kritéria patří:

  • Výběr zdrojů – Tato funkce nám umožňuje vybrat supinu zdrojů, čí přímo pouze konkrétní zdroj, popřípadě negace dané skupiny nebo zdroje. Uživatel si pak může vybrat z osmi skupin zdrojů Celostátní, TV a rozhlas, Regiony, Časopisy a ostatní, Internet, Webmonitoring, Sociální média, Webmonitoring – sk.
  • Rozšířené vyhledávání – Tato možnost nám nabízí rozšířit naše konkrétní vyhledávání o konkrétního autora, stranu, název, rubriku anebo relaci. Tyto kritéria lze také negovat a mezi kritérii lze nastavit vztah „a zároveň“ či „nebo“.
  • Výběr operátorů – V této nabídce máme několik operátorů, které se vkládají po kliknutí do vyhledávacího pole a umožňují nám tak rozšířit či konkretizovat vyhledávané slova. Operátory lze zadávat i ručně a to buď velkými či malými písmeny. Mezi operátory najdeme:
    • AND – tento operátor představuje slovní spojení „a zároveň“. Výsledky tak budou obsahovat obě klíčová slova spojené tímto operátorem.
    • OR – zastupuje slovní spojení „nebo“ a výsledkem tak budou články, které obsahují alespoň jedno klíčového slovo spojení tímto operátorem. Tento operátor lze také nahradit čárkou.
    • NOT – umožňuje vyloučit konkrétní klíčová slova, která zadáme.
    • .BEST – operátor odpovídá již předešlému operátoru OR, ale oproti němu přiřazuje výsledkům s oběma slovy vyšší váhu, než výsledkům, které obsahují pouze jedno klíčové slovo. Pod tímto operátorem si zhruba můžeme představi slovní spojení „nejlépe s“.
    • .NEAR – při použití tohoto operátoru bude vyhledávač vyhledávat články s oběma klíčovými slovy spojené tímto operátorem a budou seřazené dle relevance. Nejvýše budou články, kde jsou tato slova nejblíže. Můžeme také nastavit maximální vzdálenost slov. V takovém případě bude mít operátor například tvar „.near/16“. Přičemž číslo šestnáct představuje maximální vzdálenost. Doporučuje se používat čísla 16, což je průměrná délka české věty, a 66, což je průměrná délka českého odstavce.
    • .COUNT – pomocí tohoto operátoru můžeme určit, minimálně kolikrát by se dané slovo mělo ve výsledku objevit. Řekněme, že chceme, aby se slovo výsledku objevilo minimálně pětkrát. V takovém případě bude mít operátor tvar .count/5 a výsledkem budou články, jenž obsahují alespoň pět daných klíčových slov v jakém kolik slovním tvaru.

Důležité je ještě zmínit, že operátory .BEST, .NEAR a .COUNT je nutné použít s tečkou, aby byly využity jako operátor. Ačkoli se před operátory AND, OR, NOT tečka psát nemusí, vyhledávač s nimi dokáže pracovat i pokud budou tečku obsahovat.

Mimo těchto možností pak vyhledávací řádka dokáže pracovat s dalšími operátory, které nejsou v nabídce uvedeny. Jednak se konkrétně o tyto operátory:

  • .WORD – zabraňuje skloňování daného slova a vyhledává jen přesně zadaný tvar. Tento operátor pak lze nahradit uvozovkami.
  • .CASE – tento operátor pak zachovává uvedenou velikost písmen.

Při vyhledávání můžeme pro složitější výrazy použít kulaté závorky. Je si však potřeba dát pozor na počet levých a pravých závorek, který musí odpovídat. Dále je třeba upozornit na to, že nová slova cizího původu, což jsou většinou jména a názvy firem, se automaticky neskloňují. V takovém případě je dobré buďto uvést všechny možné tvary nebo použít operátor „*“, který nahrazuje jakákoliv písmena. Například tak při vyhledávání slova Anopress* máme jistotu, že ve výsledku budou i slova Anopressem, Anopressu apod.

Použitý vyhledávací dotaz je možné si uložit i pro budoucí použití a to pomocí tlačítka „Dotazy“ vlevo.

Novinkou, s kterou Anopress přišel v roce 2019, je vyhledávání pomocí emotikonů. (Mav, 2019)

Práce s výsledky


Kliknutím na název článku se nám zobrazí plnotextový přepis článku. Ten si dále můžeme zobrazit jako náhled originálu anebo rovnou přejít na originální stránku, pokud to je možné. Publikaci si dále můžeme uložit do vlastní schránky, stáhnout (do formátů HTML, PDF, RTF, TXT anebo CSV), poslat mailem, vytisknout anebo vygenerovat pevný odkaz na daný článek. Novější funkcí je možnost citace ve spolupráci se stránkou citace PRO.Výsledné články můžeme pomocí tlačítka vlevo pod vyhledávací konzolí seřadit od nejnovějších, dle data vydání, dle relevance, dle titulku anebo dle strany, pořadí. Vpravo pak máme možnost zapnout Anotace, díky kterým i jednotlivých článků uvidíme grafický náhled. Další možností je pak tlačítko graf, které nám zobrazí grafické zpracování článku dle data a typu, tedy zda šlo o tisk, internet, sociální média, televizi anebo rozhlas. Tento graf si následně můžeme pomocí tlačítka vpravo vyexportovat jako obrázek, pdf nebo excel.

Pro nás pak velmi podstatným číslem je procento, které se výsledcích objevuje pod každým článkem. Toto procento nám ukazuje, jak moc článek odpovídá našemu vyhledávání.

Další funkce

Jednou z dalších funkcí, kterou Anopress nabízí je možno zasílání tak zvaných alertů v případě vydaní nového článku, jež odpovídá našemu dotazu. U alertu můžeme nastavit výstup, konkrétně název, formát, kódování, vzhled, obsah, zda má klíčová slova zvýraznit a zda má články dle něčeho seskupit či jak je seřadit. Dále je možné nastavit časování, tedy zda chceme upozornění dostávat denně, týdně, měsíčně, jako konkrétní den a jaký čas. V neposlední řadě je nutné vyplnit naši emailovou adresu a potvrdit vytvoření tohoto plánu.

V pravém horním rohu si pak můžeme prohlédnout statistiky stažení anebo dashboard, který obecně zobrazuje denní statistiky nových článků. Tento dashboard je však možné si personalizovat a nastavit co se na něm má zobrazovat. Následně si dashboard můžeme nastavit jako uvítací obrazovku, když do aplikace přijdeme.

Jak Anopress ukládá publikace do databáze

Tento proces se liší dle typu publikace, tedy zda jde o tisk, televizní záznam, rozhlas anebo sociální síť.

V případě tisku je buď článek zaslán v elektronické podobě, což je nejjednodušší možnost. Článek se pak sváže s náhledem, zdrojem, opatří se potřebnými metadaty a následně se nahraje do databáze. Pokud článek přijde v grafické podobě, například přední strana novin, je použit speciální software, který identifikuje článek a přepíše jej do textové podoby. Následně je nahrán do databáze.

Co se týče televizních a rozhlasových záznamů, dříve veškeré zpracování probíhalo ručně, nyní je již většinou automatizované a ručně je pak prováděna editace. K veškerým publikacím tohoto typu tak existuje jak textový přepis, tak odkaz na nahrávku. Důležitou činností je pak zde také identifikace mluvčího.

U webmonitoringu se dříve využívali RSS kanály, dnes však Anopress využívá crawlery. Sociální sítě jsou také automaticky nahrávané, ovšem stojí za zmínku, že jsou pozorované jen veřejné profily.

Licence

Společnost NEWTON Media nabízí dva druhy ročních licencí přístupu do databáze Anopress pro instituce s jedním uživatelským přístupem. Přístup je dostupný nepřetržité a váže se k heslu a IP adrese. S možností přihlašování odkazem, kdy pak není potřeba heslo. Tento přístup využívá většina knihoven a škol, které chtějí zpřístupnit databázi svým uživatelům.

První z nich je přístup s pouze možností prohlédnout si články, které jsou jeden rok staré. V tom případě je cena na rok 1 000 Kč bez DPH. Druhá licence je pak plnohodnotná, tedy s možností prohledávat všechny články až do roku 1996. Cena této licence činí 2 750 Kč bez DPH (dle informací k roku 2019). (Veřejné informační služby knihoven, 2020)

Příklady využití

Databáze Anopress skýtá mnoho možností využití. Jednak k hledání vydaných publikací o vlastní firmě, produktech nebo například o konkurenci. Zjištění informací o oboru, ve kterém člověk působí a hlavně nových inovací v daném odvětví. Možné nové příležitosti a trhu, či obecně informace o aktuálním dění. Nebo například hledání informací o konkrétních osobách jako jsou obchodní partneři, politici, či jiné známe osobnosti.

Databáze je pak častým zdrojem pro studenty při psaní jejich závěrečných prací. To hlavně díky tomu, že společnost spolupracuje s několika vysokými školami, a tak studenti těchto škol mají k databázi Anopress volný přístup. Mezi tyto školy patří například Vysoká škola Ekonomická v Praze, Masarykova univerzita nebo Univerzita Karlova. (Anopress, 2020)

Společnost Anopress pak také od konce roku 2019 zahájila spolupráci se společností EBSCO Information Services a tak nově EBSCO Discovery Service™ indexuje i databázi Anopress. Plný text se však zobrazí jen v případě, že má daný uživatel do databáze Anopress přístup. (EBSCO Information Services, 2019)

Zdroje

Anopress IT, a.s. Anopress [online]. Copyright © 2020 NEWTON Media, a.s. [cit. 05. 02. 2021]. Dostupné z: https://www.anopress.cz/

EBSCO Information Services. EBSCO Discovery Service nově indexuje databázi Anopress [online]. 17. 12. 2019 [cit. 07. 02. 2021]. Dostupné z: https://www.ebsco.com/e/cs-cz/blog/novinky-ebsco-discovery-prosinec

Masarykova univerzita. T Monitoring on-line [online]. © 2019 Masarykova univerzita. [cit. 05. 02. 2021]. Dostupné z: https://ezdroje.muni.cz/prehled/zdroj.php?id=198&lang=cs

MAV. Anopress monitoruje postoje, emoce a nálady. In: Mediaguru.cz [online]. 2019 [cit. 05. 02. 2021]. Dostupné z: https://www.mediaguru.cz/clanky/2019/06/anopress-monitoruje-postoje-emoce-a-nalady/

Veřejné informační služby knihoven. Dokumenty — Veřejné informační služby knihoven [online]. Copyright © Národní knihovna ČR [cit. 07. 02. 2021]. Dostupné z: https://visk.nkp.cz/dokumenty

Wikipedie: Otevřená encyklopedie. Anopress [online]. © 2020 [cit. 05. 02. 2021].  Dostupné z: https://cs.wikipedia.org/wiki/Anopress

Data.gov.uk ako brána pre prístup k dátam zo Spojeného kráľovstva

0

Úvod

Data.gov.uk patria k prvým a celosvetovo uznávaným portálom s open government dátami. Od svojho založenia v roku 2010 umožňujú prístup pod otvorenou licenciou k tisíckam datasetov, rozdelených do niekoľkých kategórií, ako sú napríklad doprava, vzdelanie a ekonomika prevažne v csv formáte. Počet datasetov neustále rastie a tiež vznikajú nové využitia týchto dát v rôznych aplikáciách. Zaujímavým využitím je aplikácia zobrazujúca úroveň kriminality vo vašom okolí, alebo ďalšia aplikácia pre cyklistov, ktorá vás varuje, ktorým miestam sa vyhnúť pri vašej trase, pretože sa tam stalo veľa nehôd cyklistov. V tomto článku sa pozrieme bližšie na celý príbeh data.gov.uk, čo všetko sú jeho prínosy a vysvetlíme si ako túto stránku používať.

Príbeh za vznikom data.gov.uk

Kľúčovú úlohu pre úspech projektu data.gov.uk zohrali Tim Berners-Lee a Nigel Shadbolt. Tim Berners-Lee, ktorý je považovaný za zakladateľa World Wide Webu prišiel k ďalšej revolučnej myšlienke a to otvoreným prepojeným dátam. Vo svojom článku Linked Data definuje pravidlá ako jednoducho tieto dáta prepojiť pomocou URI, jednoduchého identifikátoru prostriedku (Berners-Lee 2006). Vďaka tomuto článku vznikol medzi prvými projekt DBpedia, ktorá prepája rôzne dáta z wikipédie a umožňuje tak nájdenie nových spojitostí. Tim ďalej pokračoval v propagácii tejto myšlienky a výborne ju preslávil na TED konferencii, kde upozornil na obrovský nevyužitý potenciál prepojených otvorených dát pre rôzne sféry a hlavne pre boj s veľkými problémami, ktorým čelí svet (Berners-Lee 2009).

Profesor Nigel Shadbolt viedol projekt Advanced Knowledge Technologies (AKT), ktorý sa zaoberal témou použitia štandardov sémantického webu pre open government dáta. Výsledky tejto práce boli prezentované parlamentu Spojeného kráľovstva a na ich základe sa vytváral aj portál data.gov.uk (Shadbolt et al. 2012). Shaldbolt spomína, že závery tohto projektu zaujali aj ľudí vo vláde, ktorí boli naklonení ďalšiemu využitiu týchto poznatkov. Hovorí tiež, že hneď po vzniku tejto priaznivej nálady vo vláde bol aj veľmi dôležitý obed Gordona Browna, vtedajšieho premiéra a Tima Bernersa-Leho, ktorý presvedčil premiéra, aby im vláda dala dáta a oni ich výmenou za to premenia na web of data. Takto sa započal projekt data.gov.uk a celý tím pre jeho vznik mali na starosti práve už spomínané osobnosti Shadbolt a Berners-Lee. (SETsquared Partnership 2010).

Trvalo len rok od spustenia projektu a na portály sa objavilo niečo cez 6000 vládnych datasetov. Vďaka ich zverejneniu pod voľnou licenciou vzniklo niekoľko zaujímavých aplikácii. Okrem už spomínaných vznikla aj napríklad JustPark, ktorá umožní vyhľadať parkovacie miesto alebo si ho rezervovať dopredu (LinkedData.Center 2015). Potom aplikácia Fix My Street zjednodušila problém nahlasovania výtlkov a ďalších problémov s cestami kompetentným autoritám (Shadbolt 2011).

Open government dáta sa postupne stali trendom vo svete, a nakoniec dorazili aj do našich končín. Úplne prvou stránkou s open gevernment dátami bola americká data.gov, ktorá vznikla za podpory Obamovej administratívy. Druhou nato bola britská data.gov.uk. Neskôr u nás vznikli národné portály pre prístup k otvoreným dátam ako sú data.gov.cz a data.gov.sk. Metropoly oboch krajín prišli s vlastnými iniciatívami, ktoré pre Česko predstavuje Praha s opendata.praha.eu a na Slovensku Bratislava s opendata.bratislava.sk.

Čo priniesli data.gov.uk?

So začatím používania portálu nastal zásadný posun mentality zo strany štátnej aparatúry. Zmenil sa postoj udržiavania dát u seba a prípadného sprístupnenia za nejaký poplatok na zverejňovanie všetkých dát pod voľnou licenciou až na tie, ktoré sú súkromného charakteru. Shaldbolt hovorí, že práve táto zmena prináša vytváranie oveľa väčšej hodnoty, ako by boli niekde nečinne uložené, prípadne zverejnená len ich časť na požiadanie a za poplatok (SETsquared Partnership 2010).

Kapoor, Weerakkody a Sivarajah prehľadne zhrnuli benefity, ktoré by mali používaním open government platform vzniknúť. Prvou je zvýšenie transparentnosti zo strany štátu. Zverejnené vládne dáta by mali zvýšiť dôveru občanov a zároveň im umožniť lepšiu verejnú kontrolu nad tým, čo sa deje v štáte. Ďalším prínosom by mala byť podpora ekonomického rastu. Zverejnenie týchto dát pod otvorenou licenciou, by malo umožniť trhu vytvoriť nové produkty a služby. Tie by mali zvýšiť produktivitu, niektorej štátnej inštitúcie alebo inej spoločnosti naviazanej na dané dáta. Vzniknutie nového produktu by malo priniesť zamestnanosť a tá zase priniesť príjem pre štát vo forme daní. Za sociálny benefit môžeme považovať nové možnosti interakcie občanov s vládou. Tie by mali byť interaktívne a zároveň lepšie poskytovať informácie. Ďalej by malo dôjsť k zvýšeniu efektivity a redukcii nákladov inštitúcii, pretože získavanie dát je časovo a finančne náročne. Tým, že sa dáta otvorili verejnosti, by malo dôjsť k zvýšeniu ich kvality, keďže sú dostupné k verejnej kontrole. Tá by mala upozorniť na chýbajúce a nesprávne dáta. Shadbolt spomína príklad ako sa prvýkrát zverejnil zoznam všetkých autobusových zastávok v uk a za krátku dobu verejnosť prišla na to, že cez 12% zo všetkých zastávok je na úplne inom mieste, ako by mali byť podľa daného datasetu (SETsquared Partnership 2010). Podpora inovácii je tiež dôležitým benefitom. Nové poskytnuté dáta sú príležitosťou pre vývojárov k tvorbe nových inovatívnych riešení (Kapoor et al. 2015, s. 264).

Data.gov.uk majú význam nielen pre podporu transparentnosti a inovácii, ale aj vo vede. Štúdia od Yana a Webera z Washingtonskej univerzity, ktorá skúmala využitie open government dát v peer-reviewed literatúre zistila, že tento druh zdrojov dát sa využíva stále viac a to naprieč rôznymi vedeckými disciplínami. Najviac využívaným zdrojom z celkovo 1229 skúmaných článkov boli práve data.gov.uk a boli dokonca ešte viac používané ako americký portál data.gov. Najčastejšie používaným datasetom v skúmaných článkoch tejto štúdie bol „index of deprivation“ a bol používaný hlavne v oblasti výskumu verejného zdravia a medicíny (Yan a Weber 2018).

Vedecké disciplíny využívajúce open government dáta vo výskume
Vedecké disciplíny využívajúce open government dáta vo výskume (Yan a Weber 2018)
Prehľad 30 najpoužívanejších OGD stránok vo výskume (Yan a Weber 2018)
Prehľad 30 najpoužívanejších OGD stránok vo výskume (Yan a Weber 2018)

Ako používať data.gov.uk

Stránka prešla zásadným redizajnom v roku 2018, aby viac zapadala do siete ostatných vládnych stránok Spojeného kráľovstva a zároveň sa zjednodušila pre bežného používateľa. Vďaka tomu zmizlo aj viacero zaujímavých podsekcií stránky, ako napríklad rôzne štatistiky používania webu, alebo prehľad aplikácii používajúcich open dáta z tejto stránky.

Pôvodný dizajn stránky Zdroj: https://web.archive.org/web/20170710012634/https://data.gov.uk/data/site-usage#totals
Aktuálny vizuál po redizajne stránky Zdroj: https://data.gov.uk/

Kategórie

Hneď na domovskej stránke je rázcestie s kategóriami, do ktorých sú roztriedené jednotlivé zverejnené dáta. Kategórie sú prehľadné a zrozumiteľné aj pre laického používateľa. Nižšie je uvedený ich zoznam aj s popisom obsahu:

Business a ekonómia

  • Datasety o medzinárodnom obchode (clá, export, import), daniach, devízových rezervách, covid pomoci pre ekonomiku, malých a stredných podnikoch a vývoji priemyslu všeobecne.

Zločin a spravodlivosť

  • Základné prehľadové datasety o polícií, súdoch a väzniciach (lokalita, zamestnanci). Ďalej dáta o kriminalite, napríklad o podvodoch, alebo podpaľačstve. Tiež sa zaznamenávajú aj údaje o tom, kedy boli použité strelné zbrane políciou. Ďalej tu sú datasety o situácii na hraniciach a imigrácií.

Obrana

  • Sprístupnené dáta o vojenských zložkách, civilných zamestnancoch v armáde, penzijných schémach pre armádu, ostrých streľbách vo vojenských obvodoch, bezpečnostnej situácii, zdravotných incidentoch v armáde, pátracích a záchranných operáciách.

Vzdelanie

  • Údaje o zamestnancoch v školstve, o knižniciach, mládežníckych organizáciách, dochádzke študentov, školách, kvalifikáciách a národnom kurikulu.

Životné prostredie

  • Dáta o životných podmienkach zvierat, vývoji počasia, oblastiach s rôznymi formami environmentálnej záťaže, živelných pohromách, ochrane lesov, riek, kvality vzduchu, geologické dáta a poľnohospodárstvo.

Vláda

  • Prehľad o riadení pracovných síl, platy zamestnancov, inovačné a výkonnostné reporty, nehnuteľnosti, záznamy o stretnutiach s externými organizáciami a business plány oddelení.

Vládne výdaje

  • Datasety so všetkými platby v štátnom sektore nad 25 000 libier.

Zdravotníctvo

  • Dáta o zdravotných testoch, fajčení, drogách, alkohole, potravinovej hygiene, prevencii rakoviny, účinnosti liečby a výdaje nemocníc nad 25 000 libier.

Mapovanie

  • Rôzne mapy lokalít (morské dno a suchozemský terén) a adresy, vlastníctva pozemkov, letecké fotografie, parkovacie zóny, stav ciest , volebné miestnosti a zastávky hromadnej dopravy.

Spoločnosť

  • Zamestnanosť, podpora v nezamestnanosti, nezamestnanosť mladých, komunitné služby, rodinné financie, nízkopríjmové skupiny obyvateľstva, viera, populácia a jej mobilita.

Mestá

  • Bývanie, územné plánovanie, verejné priestranstvá, voľný čas, lokality prípojok na inžinierske siete, energie a odpady, spotreba, zelená infraštruktúra a bezdomovectvo.

Doprava

  • Letiská, cesty, plánované rekonštrukcie ciest, osvetlenie ciest, nákladná doprava, železničná sieť, elektrické autá, parkovanie, autobusy, hustota dopravy, lokality semaforov, chodníky, cyklotrasy a licencie pre taxislužby (data.gov.uk 2021).

Filtre

Po výbere konkrétnej kategórie, ktorá nás zaujala si môžeme ešte viac spresniť naše vyhľadávanie pomocou dostupných filtrov. Prvým je filter podľa inštitúcie, ktorá dané dáta zverejnila. Zoznam dostupných inštitúcií sa líši podľa našej predchádzajúcej voľby kategórie a priebežne sa aktualizuje. Nižšie na obrázku môžeme vidieť filter podľa inštitúcie v kategórií obrana.

Filter s voľbami inštitúcií. Zdroj: https://data.gov.uk/

Druhým filtrom, podľa ktorého môžeme spresniť naše vyhľadávanie je filter podľa dátového formátu. Väčšina prístupných súborov je v csv formáte, ale niekedy sa nájdu aj iné ako napríklad json, xlsx a ďalšie.

Filter s voľbou dátového formátu. Zdroj: https://data.gov.uk/

Tretí z dostupných filtrov je zameraný na licenciu, pod ktorou sú zverejnené datasety. Väčšina z datasetov na data.gov.uk je zverejnená pod voľnou licenciou Open Government Lice, ale pre istotu je vhodné zaškrtnúť toto políčko a ústiť sa, že skutočne spadajú pod spomínanú licenciu.

Filter pre Open Government Licenciu. Zdroj: https://data.gov.uk/

Výsledky vyhľadávania si môžeme zoradiť podľa dátumu pridania datasetu, alebo podľa zhody s našim vyhľadávaním.

Filter pre zoradenie podľa dátumu pridania, alebo najlepšej zhody. Zdroj: https://data.gov.uk/

Open Government Licence

Ako už bolo spomenuté, majorita datasetov na data.gov.uk spadá pod open governmnet licence. Tá je aktuálne v tretej verzii a umožňuje:

  • Kopírovať, publikovať a distribuovať informácie
  • Prispôsobiť informácie
  • Využívať informácie komerčným a nekomerčným spôsobom, napríklad ich kombinovaním s ostatnými informáciami, alebo ich využitím vo vlastnom produkte, či aplikácii

Pri použití dát je nutné:

  • Potvrdiť zdroj informácie vo vašom produkte, alebo aplikácii pomocou výslovného uvedenia prehlásenia (attribution statement, ktorý je špecifikovaný poskytovateľom) o zdroji, alebo uvedením prepojenia naň. A ak je to možné uviesť aj odkaz na Open Government Licenciu.

Niektoré výnimky z licencie:

  • Súkromné dáta
  • Doklady totožnosti, ako je napríklad cestovný pas
  • Vojenské insígnie
  • Intelektuálne vlastníctvo, ako sú patenty a ochranné známky

Podrobnejší zoznam výnimiek, ďalšie špecifikácie k licencii a znenia predchádzajúcich verzií sú uvedené na stránke národného archívu: http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/

Princípy publikovania dát na data.gov.uk

Profesor Shadbolt predstavil na konferencii IIEA niekoľko zásadných princípov publikovania dát, vyžadovaných od vládnych inštitúcii pre data.gov.uk. Jedným z problémov, s ktorým sa pri projekte stretli bol problém takzvaného „data huggingu“, keď inštitúcie veľmi neradi sprístupňovali svoje dáta hocikomu inému. To sa snažili zmeniť a vytvoriť princíp, kde sa publikujú všetky dáta až na tie, u ktorých máme dobrý dôvod ich nezverejňovať (napríklad súkromné dáta). Ďalším navrhovaným princopom je, že publikované dáta by mali byť v znovu použiteľnom a strojovo čitateľnom formáte. Tiež dáta by sa mali publikovať pod otvorenou licenciou, ktorá umožňuje opätovné použitie aj pre komerčné účely (Open Government Licence). Verejné inštitúcie majú práve podporovať a propagovať používanie týchto dát verejnosťou. Pre lepšie pochopenie ako čo najlepšie publikovať dáta navrhli používať pomôcku od Tima Bernersa-Leeho „Five stars to stardom“, ktorá pomocou počtu hviezdičiek určuje kvalitu zverejnených dát (Shadbolt 2011).

* Zverejniť dáta na web v hociktorom formáte

** Zverejniť ich v štruktúrovanom formáte

*** Používať tvorené štandardy a formáte pre zverejnené dáta

**** Používať URL k identifikácii dát

***** Prepojiť naše zverejnené dáta s ostatnými zverejnenými dátami

Ak by boli dáta zverejnené aj s prepojením na ostatné dáta, tak sa odstráni ďalší častý problém, ktorý sa vyskytoval v projekte a to „dátové silá“. Koncept dátových síl predstavuje jednotlivé oddelenia, alebo inštitúcie, ktoré disponujú dátami, avšak vôbec nie sú medzi sebou prepojené a preto sa nevyužíva ich plný potenciál .

Ilustrácia dátových síl. Zdroj: https://pixabay.com/sk/photos/sil%C3%A1-skladovanie-obilia-1598168/

Ako používať data.gov.uk?

Používanie data.gov.uk je veľmi jednoduché, ale pozrime sa na jeden konkrétny príklad. Dajme tomu, že chceme nájsť aktuálne dáta o hlučnosti pre jednotlivé lokality v Spojenom kráľovstve. Pre efektívnejšie vyhľadávanie využijeme možnosť voľby kategórie aj filtre. Na začiatok si zvolíme príslušnú kategóriu, kde očakávame, že by sa mali údaje o hlučnosti nachádzať. Preto si pre naše vyhľadávanie zvolíme životné prostredie (Environment). Dáta chceme mať vo vhodnom formáte pre prácu s nimi a preto si v ďalšom filtri volíme formát csv. Ďalej ešte zaškrtneme filter pre zobrazenie dát len pod Open Government Licenciou. Pre zobrazenie najaktuálnejších dát si ešte zvolíme zoradenie podľa najnovších dát namiesto najväčšej zhody. Do vyhľadávacieho poľa použijeme výraz noise exposure, ktorý by mal dobre reprezentovať náš predmet vyhľadávania.

Ukážka vyhľadávania č.1 Zdroj: https://data.gov.uk/

Po spustení vyhľadávania by sme mali dostať podobný výsledok.

Ukážka vyhľadávania č.2 Zdroj: https://data.gov.uk/

V čase písania tohto článku bol najaktuálnejším datasetom Noise Exposure data – Round 3. Na stránke venovanej nemu si môžeme pozrieť detailnejšie informácie o ňom, kedy bol prevedený poslednýkrát update, podrobnejší popis datasetu a s nim súvisiace datasety.

Ukážka vyhľadávania č.3 Zdroj: https://data.gov.uk/
Ukážka vyhľadávania č.4 Zdroj: https://data.gov.uk/

Pred stiahnutím dát si ich ešte môžeme pozrieť v náhľade. Alebo ak by sme našli nejaké nezrovnalosti, prípadne mali otázku ohľadom dát, môžeme kontaktovať danú inštitúciu zodpovednú za dataset.

Ukážka vyhľadávania č.5. Zdroj: https://data.gov.uk/

Pre pokročilejších používateľov je k dispozícií prístup pomocou API. Používa sa CKAN API a detailný návod ako s ňou pracovať je na stránke: https://docs.ckan.org/en/2.7/api/index.html

Záver

Data.gov.uk sú skutočne výborným zdrojom dát z prostredia Veľkej Británie. To dokazujú užitočné aplikácie, ktoré vďaka nim vznikli, ale aj veľké množstvo výskumných projektov z rôznych vedeckých disciplín. Výraznejšie zverejňovanie umožnilo lepšiu kontrolu zo strany verejnosti a vytvorilo priestor pre inovácie. Dizajn stránky je prehľadný a vie sa v ňom zorientovať aj menej skúsený používateľ. Akurát by sa dalo vytknúť, že nie vždy všetky datasety sú v najlepšej kvalite a možno by mohli byť častejšie aktualizované. Avšak celkovo sa jedná o prínosnú stránku, na ktorej sa dá nájsť jednoducho veľké množstvo užitočných informácii.

Použité zdroje:

BERNERS-LEE, Tim, 2006. Linked Data. https://www.w3.org/ [online] [cit. 7.2.2021]. Dostupné na: https://www.w3.org/DesignIssues/LinkedData.html

BERNERS-LEE, Tim, 2009. Tim Berners-Lee: The next Web of open, linked data – YouTube [online] [cit. 7.2.2021]. Dostupné na: https://www.youtube.com/watch?v=OM6XIICm_qo&ab_channel=TED

DATA.GOV.UK, 2021. Find open data – data.gov.uk. data.gov.uk [online] [cit. 10.2.2021]. Dostupné na: https://data.gov.uk/

KAPOOR, Kawaljeet, Vishanth WEERAKKODY a Uthayasankar SIVARAJAH, 2015. Open Data Platforms and Their Usability: Proposing a Framework for Evaluating Citizen Intentions. V: Marijn JANSSEN, Matti MÄNTYMÄKI, Jan HIDDERS, Bram KLIEVINK, Winfried LAMERSDORF, Bastiaan VAN LOENEN a Anneke ZUIDERWIJK, ed. Open and Big Data Management and Innovation [online]. Cham: Springer International Publishing, s. 261–271. Lecture Notes in Computer Science. ISBN 978-3-319-25013-7. Dostupné na: doi:10.1007/978-3-319-25013-7_21

LINKEDDATA.CENTER, 2015. Almost 400 apps that use uk gov open data – documentation portal [online] [cit. 10.2.2021]. Dostupné na: http://sites.linkeddata.center/help/business/cases/296-apps-that-use-uk-datasets

SETSQUARED PARTNERSHIP, 2010. Transparency and Open Data: data.gov.uk [online]. [Youtube]. 2010. SETSQUARED PARTNERSHIP. Dostupné na: https://www.youtube.com/watch?v=vBNPIiKi00w&t=432s&ab_channel=SETsquaredPartnership

SHADBOLT, Nigel, 2011. A year of data.gov.uk. The Guardian [online]. 2011 [cit. 10.2.2021]. Dostupné na: https://www.theguardian.com/news/datablog/2011/jan/21/data-gov-nigel-shadbolt-government

SHADBOLT, Nigel, 2011. Nigel Shadbolt on UK Government Open Data Initiative [online]. [Youtube]. 2011. SHADBOLT, Nigel. IIEA. Dostupné na: https://www.youtube.com/watch?v=srPinVmjBOE&t=595s&ab_channel=IIEA

SHADBOLT, Nigel, Kieron O’HARA, Tim BERNERS-LEE, Nicholas GIBBINS, Hugh GLASER, Wendy HALL a m c SCHRAEFEL, 2012. Linked open government data: lessons from Data.gov.uk. IEEE Intelligent Systems [online]. 2012, roč. 27, č. 3, s. 16–24. ISSN 1541-1672. Dostupné na: doi:10.1109/MIS.2012.23

YAN, An a Nicholas WEBER, 2018. Mining Open Government Data Used in Scientific Research. V: Gobinda CHOWDHURY, Julie MCLEOD, Val GILLET a Peter WILLETT, ed. Transforming Digital Worlds [online]. Cham: Springer International Publishing, s. 303–313. Lecture Notes in Computer Science. ISBN 978-3-319-78105-1. Dostupné na: doi:10.1007/978-3-319-78105-1_34