Při vyhledávání informací o různých společnostech v České republice není vždy nutné, a rozhodně ne nejefektivnější, procházet jednotlivé výroční zprávy a finanční uzávěrky uložené v obchodním rejstříku, často ve formě naskenovaných a nečitelných souborů pdf. Pokud je Vaším cílem získat informace o více společnostech v takové podobě, aby se s nimi dalo jednoduše nakládat, musíte si na to vyhradit v kalendáři poměrně velké časové okno.
Práci s vyhledáváním informací tohoto typu Vám může ulehčit několik nástrojů, jako například Cibis od společnosti Crif.
Informační zdroj Cribis
Cribis je nástroj využívaný především firmami které hledají informace o jiných firmách, ať už se jedná o výběr dodavatele, prověření důležitého klienta nebo sondování dat o konkurenci. Nabízí přehledně uspořádaná data o vazbách mezi jednotlivými společnostmi, vlastnících a vedení firem, veřejných zakázkách, které firma získala, souhrnné informace o finančním stavu dané firmy nebo třeba o probíhajících exekucích.
Aplikace Cribis byla vyvinuta a je provozována společností CRIF – Czech Credit Bureau, a. s. a obsahuje informace o všech firmách, které jsou z České nebo Slovenské republiky. Aplikace čerpá z více než 85 různých datových zdrojů včetně or.justice.cz nebo ARES. Volitelně lze přidat i modul SkyMinder, kde lze prověřovat na 200 milionů společností z téměř celého světa. (“O nás – Cribis.cz,” 2021)
Vyhledávání v Cribis a struktura výstupů
Jak je zmíněno výše, v Cribisu lze ke každé firmě najít mnoho informací různého druhu. Pokud se budeme bavit o použití aplikace v uživatelském režimu a ne například využití API, první krok pro vyhledání firmy je uvedení jejího názvu nebo IČ. Případně lze vyhledávat firmy i podle bankovního spojení nebo adresy.
Obr. 1: Vyhledání právnické osoby (zdroj: cribis.cz, 2021)
V aplikaci je rovněž možné vyhledávat fyzické osoby, tedy pokud se jedná o majitele či jednatele některé z právnických osob na území ČR nebo SR.
Obr. 2: Vyhledání fyzické osoby (zdroj: cribis.cz, 2021)
Po úspěšném vyhledání lze zobrazit požadované informace v několika různých formátech. Nejprve je zobrazen základní přehled s údaji o firmě jako IČ, DIČ, NACE, přibližný počet zaměstnanců, apod.
Obr. 3: Základní přehled (zdroj: cribis.cz, 2021)
Dále je možné zobrazit Cribisem připravený report ve dvou variantách (short a global). Především ve verzi global je možné najít informace roztříděné do kategorií jako finanční ukazatele, zveřejněné smlouvy, dotace nebo varovné informace (např. zda je firma vedena v insolvenčním rejstříku).
Na obrazku 4 jsou vybrané finanční ukazatele rozdělené podle typu na ziskové (ROE, ROA,…), finanční (zadluženost či likvidita) a pracovně – kapitálové(Obrátka aktiv nebo doba obratu zásob).
Obr. 4: Finanční ukazatele (zdroj: cribis.cz, 2021)
Dále lze sledovat například smlouvy, které musela firma zveřejnit ze zákona, které jsou rozděleny podle toho, zda firma vystupuje jako dodavatel nebo objednatel, zúčastněnou protistranu i smluvní a celkovou částku za provedení služby, viz obrázek 5. Rovněž jsou v rámci reportu obsaženy i dotace, které firma čerpá či čerpala v minulosti. Jak je vidět na obrázku 6, lze vyčíst název dotovaného projektu, poskytovatele i datum poskytnutí dané dotace.
Obr. 5: Zveřejněné smlouvy (zdroj: cribis.cz, 2021)
Obr. 6: Dotace (zdroj: cribis.cz, 2021)
Velice užitečným nástrojem je pak diagram vazeb mezi subjekty, který lze velice dobře (dle názoru autora nabízí Cribis mnohem větší možnosti úpravy vstupního hledání než srovnatelné diagramy vazeb na jiných webových stránkách) upravit pomocí filtrování vazeb tak, aby zůstaly pouze ty relevantní pro dané hledání. Filtrovat lze podle typu vazby (například majetkové, obchodní či koncový uživatel výhod nebo-li skutečný majitel). Vazbu majetkové účasti ke možné dále omezit procentním podílem a hledat tak například pouze vazby nad 50 % podílu ve společnosti. Tyto vazby lze poté hledat až do čtyř úrovní, což je velice dobře využitelné například při hledání celé skupiny ekonomicky spjatých osob.
Obr. 7: Diagram vazeb (zdroj: cribis.cz, 2021)
Dalším nástrojem, který aplikace Cribis poskytuje je tabulka zobrazující celou skupinu ekonomicky spjatých osob, do které hledaná firma spadá. To je využitelné zejména pro účely AML a pro řízení rizik v bankách při prošetřování hromadného rizika pro celou skupinu. Tvorba této skupiny se řídí podle přesně specifikované metodiky a už tu nelze filtrovat vazby podle toho, které uživatele zajímají. Hlavním vztahem, kterým se tento report řídí je majetková účast vyšší než 50 %.
Obr. 8: Skupina ekonomicky spjatých osob (zdroj: cribis.cz, 2021)
Využití aplikace
Jak je zmíněno výše v textu, aplikaci využívají především větší společnosti, které hledají informace o svém okolí, ať už se jedná o klienty, partnery či konkurenty. Užitečnou funkcí je bezesporu srovnání finančních ukazatelů za několik let, což velmi usnadňuje proces odhadu vývoje budoucí prosperity hledané společnosti, když odpadá nutnost procházet a analyzovat dokumenty s finančními uzávěrkami za poslední roky. Pro banky je z důvodů compliance, AML a řízení rizik naprosto klíčová informace o vlastnících společnosti, potažmo skupina ekonomicky propojených osob neboli ESSO, jejíž kompletní vytvoření zabere mnoho času.
K datům Cribisu lze přistupovat přes webový portál jako běžný uživatel, pomocí instalované LAN verze nebo objednávat pouze extrakty dat či přistupovat pomocí API a data z Cibisu automaticky párovat s vlastním softwarem a dál s nimi pracovat v jeho vlastním prostředí. Některé banky například rozšiřují model Cribisu ke skupinám ekonomicky spjatých osob o další vztahy, které Cribis nebere v úvahu a vytváří si vlastní diagramy vazeb apod. U této varianty lze filtrovat jaká data a k jakým společnostem má aplikace zasílat, aby nedošlo ke zbytečnému zahlcení. Aplikaci lze napojit na většinu známých řešení v oblasti ERP, CRM a BI. Je samozřejmé, že licenční poplatky se odvíjejí od počtu uživatelů, zvoleném přístupu k datům, případně frekvenci aktualizace dodávaných dat. Velkou výhodou tohoto přístupu pak jsou velmi široké možnosti vyhledávání přímo v databázových systémech, například použitím jazyka SQL.
Závěr
Dle mého úsudku se jedná o velice efektivní nástroj, který velmi usnadňuje práci především pracovníkům v rámci útvarů řízení rizik ve větších podnicích, kteří mají za úkol zkoumat velké množství informací o klientech či obchodních partnerech. V případě, že množství takto vyhledávaných informací není veliké, považuji za dostačující volně dostupné zdroje jako or.justice.cz místo placení licencí k aplikacím jako je Cribis nebo DnB (podobný zdroj dat). V případě, kdy je potřeba dohledávat informace k desítkám firem denně nebo automatizovaně dodávat informace o firmách do vlastního softwaru, je Cribis výborným a vysoce efektivním nástrojem.
Při práci s ním jsem zaznamenal drobné nedostatky při zpracování určitých složitějších vlastnických vztahů, kdy například z obchodního rejstříku nečte údaje v poznámce (většinou o tom, že někdo jedná na účet jiné osoby) nebo případy společných obchodních podílů či podílů ve firmách vložených do svěřenských fondů. Tyto informace jsou v reportech a diagramech Cribisu většinou zcela vynechány. Nicméně tyto jevy nejsou nikterak časté, jedná se v českém prostředí spíše o výjimky. Je tedy pochopitelné, že algoritmus aplikace, který tato data vyhledává a sbírá přehlédne podobné informace, protože nebývají uležené ve stejném poli, ale pouze formou poznámky. Vyjma tohoto drobného nedostatku považuji Cribis za velmi dobrý informační zdroj ve své kategorii.
SocialBearing je vyhledávač pro sociální síť Twitter. Je zdarma a online k dispozici na webu. Většinu funkcí má k dispozici bez přihlášení, pro některé funkce je ale nutné se přihlásit přes twitterovský účet. V souhrnu vyhledává, filtruje a řadí tweety nebo lidi podle angažovanosti, vlivu, místa sentimentu a dalších vlastností.
Vyhledávací možnosti
Na hlavní stránce vyhledávače je možné zvolit, co chceme vyhledávat:
Přátele jakéhokoliv veřejného účtu.
Sledující jakéhokoliv veřejného účtu.
Lidé, kteří odpovídají vyhledávaným slovům.
Pozice tweetu na mapě podle hashtagu (volitelné) a místa (nutné zadat radius).
Analýza časové osy pro jakýkoliv veřejný účet.
Tweety, které obsahují klíčová slova nebo hashtagy.
Zde je možné rozšířené vyhledávání.
Jednotlivé položky budou představeny v následujících sekcích.
Obrázek 1: Vyhledávací menu webu SocialBearing.com.
Vyhledávání přátel a sledujících
Po vyhledání uživatelského jména se zobrazí přehled 100 přátel/sledujících, pokud si chci zobrazit přehled dalších 100, tak si je musím načíst. Zobrazení je pro tyto dva typy vyhledávání stejný, dává nám k dispozici informace o:
celkových číslech uživatelů,
koláčové grafy jazyků uživatelů a zařízení které používají,
grafy aktivit v průběhu dne, počtu tweetů, rozložení počtu sledujících a sledovaných,
cloud hashtagů a použitých slov,
mapa zemí, ke které se uživatelé hlásí,
výčet uživatelů.
V levém panelu jsou k dispozici základní informace o uživateli a rozsáhlé možnosti filtrování, díky kterému se může zúžit výčet informací o uživatelích, kteří nás zajímají.
Jednou ze zajímavých informací o profilu je „TUQI Score“. Je to hodnota, kterou vypočítává SocialBearing z mnoha metrik (např. počet sledujících, srovnání tweetů/sledujících, datum posledního tweetu a další). TUQI Score je pokus, jak značit kvalitu účtu, kde vyšší hodnota značí zajímavý, aktivní účet, zatímco účet s nízkým TUQI Score pravděpodobně značí spam uživatele nebo uživatele, který není tolik aktivní.
Obrázek 2: Náhled na statistiky sledujících.
Lidé, kteří odpovídají vyhledávání
Zde se dají vyhledávat lidé, kde vyhledávaný výraz jde najít ve jménu, biu, zájmech, poloze, nebo jiných kritériích. Na začátku se zobrazuje 20 uživatelů, ale přes tlačítko „show more“ se mohou ukázat další uživatelé.
Po vyhledání jsou k dispozici následující informace:
celková čísla výsledků,
koláčové grafy jazyků uživatelů a zařízení které používají,
grafy aktivit v průběhu dne, počtu tweetů, rozložení počtu sledujících a sledovaných,
cloud hashtagů a slov objevujících se v biu uživatelů,
mapa zemí ke které se uživatelé hlásí,
výčet uživatelů.
V levém panelu je k dispozici přehled uživatelů s největším počtem sledujících, s největším počtem tweetů a dále další možnosti filtrování.
Obrázek 3: Výsledek hashtag mapy při vyhledávání slova „Slavia“.
Geolokace tweetů
V tomto vyhledávači se zobrazují tweety dle polohy a případně upřesněná o klíčová slova / hashtagy. Lokace se omezuje okruhem kilometrů, který se dá nastavit v rozsahu 2-2000 km. Hlavním výsledkem tohoto vyhledávání je mapa, kde jsou na mapě zobrazeny místa, kde byly napsány tweety, které byly vyhledány.
Po vyhledávání jsou k dispozici následující informace:
mapa tweetů,
celková čísla výsledů,
grafy tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatelů, jazyka, sdílené domény),
cloud hashtagů a slov objevujících se v tweetech,
seznam tweetů.
V levém panelu jsou k dispozici rozsáhlé možnosti filtrování.
Obrázek 4: Výsledek vyhledávání tweetů v Praze (radius 2 km).
Časová osa uživatele
Předposledním vyhledáváním, které zde bude představeno, je časová osa vyhledávaného uživatele pomocí uživatelského jména. Zobrazuje v levém panelu základní informace o uživateli a možnosti filtrování tweetů. Hlavním výsledkem vyhledávání jsou statistiky tweetů uživatele a jejich analýza. Základně se zobrazuje 200 nejnovějších tweetů, ale stejně jako v předchozích sekcích, i zde je možnost počet těchto tweetů rozšířit.
Po vyhledávání jsou k dispozici následující informace:
celková čísla uživatele,
grafy tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatele, jazyk tweetů, sdílené domény),
Poslední sekcí je vyhledávání tweetů pomocí klíčových slov a hashtagů. Zde je k dispozici i rozšířené vyhledávání ve kterém je možné se omezit pouze na fotky/odkazy/videa/verifikované, nebo aplikovat jiné rozšířené vyhledávání. Zároveň jde vyhledávání upřesnit na přesnou shodu.
Po vyhledávání jsou k dispozici následující informace:
celková čísla vyhledávání,
grafy vyhledaných tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatele, jazyk tweetů, sdílené domény),
cloud hashtagů a slov objevujících se v tweetech,
seznam tweetů.
Obrázek 6: Výsledky hledání tweetů s obsahem „Carlsen Nepomniachtchi“ ve světě.
Speciální nástroje ve vyhledávání
Tweets by sentiment
Jedná se o analýzu, která je ukázána u tweetů v podobě grafu. Hodnotí jaký sentiment mají tweety a to podle slov, které vyhledávač najde v tweetech. Má naučenou databázi slov, která dokáže přiřadit k jednotlivým sentimentům. Je to dobře viditelné na obrázku 7, kde jsou citově zabarvená slova zvýrazněna(červeně – záporný tweet, zeleně – kladný tweet). Bohužel vyhledávač neumí rozpoznat ironii, takže je nutné brát hodnocení s odstupem.
Dalším zajímavým výsledkem vyhledávání, který stojí za zmínku je mapa hashtagů a slov, které jsou v nalezených tweetech. Na obrázku 8 je vidět, že twitterem hýbe dnešní krize na ukrajině a je s ním ve velkém spojováno slovo Rusko, Ukrajina a válka.
Obrázek 8: Hashtag cloud a word cloud výsledku vyhledávání „Russia“.
Export do csv
Některé vyhledané informace jde uložit do souboru formátu csv. Díky tomu můžeme vyhledávač použít pro najití dat, se kterými budeme dále pracovat a vytvářet si vlastní analýzu, nebo jiné zpracování dat.
Závěr
SocialBearing.com je zajímavý vyhledávač, pokud chceme zjistit širší pohled na Twitter tématiku, kouknout se na statistiky tweetů, nebo uživatelů. Nebo pokud si jen chceme analyzovat vlastní profil. Výhoda vyhledávače je, že je zdarma. Nevýhodu, kterou jsem objevil je, že nové tweety zakrývají starší do pozadí a vyhledávání geolokace tweetů probíhá velmi pomalu a často se výsledek nezobrazí.
Zdroje
Twitter analytics for Tweets, timelines & twitter maps: Social Bearing. Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing. (n.d.). Retrieved December 8, 2021, from https://socialbearing.com/.
Seznam obrázků
Obrázek 1: Vyhledávací menu webu Socialbearing.com. [Zdroj: https://socialbearing.com/]
Obrázek 2: Náhled na statistiky sledujících. [Zdroj: https://socialbearing.com/]
Obrázek 3: Výsledek hashtag mapy při vyhledávání slova „Slavia“. [Zdroj: https://socialbearing.com/]
Obrázek 4: Výsledek vyhledávání tweetů v Praze (radius 2 km). [Zdroj: https://socialbearing.com/]
Sčítání lidu v USA je řízeno pod záštitou organizace United States Census Bureau (UCSB), v češtině tzv. Americký úřad pro sčítání lidu. Ten poskytuje údaje o lidech a ekonomice národa. Každých 10 let provádí sčítání lidu, domů a bytů, do kterého se počítají všichni obyvatelé Spojených států. Agentura také shromažďuje údaje prostřednictvím více než 100 dalších průzkumů u domácností a podniků každých jeden až pět let.
Četné sčítání a průzkumy každý rok pomáhají jednotlivým státům, místním komunitám a podnikům rozdělit více než 675 miliard dolarů ve federálních fondech a zároveň pomáhají státům, místním komunitám a podnikům při přijímání informovaných rozhodnutí. Podniky používají údaje ze sčítání k určení, kde by měly být postaveny sklady, kanceláře a obchody, což vede k vytváření pracovních míst. Developeři k výstavbě nových domů a revitalizaci stávajících. Sčítání používají místní samosprávy k veřejné bezpečnosti a připravenosti na mimořádné události. Obyvatelé používají sčítání k prosazování politiky, kvality života a programů prosazování práv spotřebitelů ve svých komunitách.
První sčítání proběhlo více než rok po inauguraci prezidenta George Washingtona a těsně před skončením druhého zasedání prvního kongresu. Za sčítání lidu z roku 1790 dostali od kongresu odpovědnost jednotliví maršálové. Pohlaví, barva, vztah k osobě v čele domácnosti, jméno osoby v čele domácnosti a případně počet otroků, to vše bylo součástí šesti šetření v roce 1790. Maršálové některých států šli nad rámec těchto dotazů a shromažďovali informace o zaměstnání a počtu bytů ve městě.
Typologie datasetů
Řada základních statistik podnikání (Core Business Statistics)
V pěti tabulkách dat, které jsou zveřejněny na data.census.gov počínaje zářím 2019, nabízí řada Core Business Statistics řadu statistik o počtu provozoven, pracovních míst, mezd a hodnotě tržeb, příjmů, příjmů nebo zásilek pro provozovny společností s platícími pracovníky pro jednotlivá odvětví na úrovni USA nebo státu.
Statistiky dle geografie (Geographic Area Series)
Série geografických oblastí obsahuje komplexní odvětvové statistiky pro podniky s platícími pracovníky podle zeměpisných oblastí. Informace jsou založeny na severoamerickém průmyslovém klasifikačním systému (NAICS) pro rok 2017.
Shrnující statistiky (Subject & Summary Series)
Tyto statistiky obsahují souhrnná data dle odvětví a dalších specifických témat. Tyto údaje víceméně shrnují informace, které jsou zveřejněny v datových řadách pro podnikání či pro jednotlivá geografické oblasti. Obsah těchto sérií je nadále seskupen dle tematických sestav, které např. zahrnují: produktové řady, provozny a jejich velikosti, lokaci výrobních závodů apod. Data pro tato témata jsou primárně k dispozici na úrovni USA a u vybraných témat na úrovni státu.
Kategorizace dat
Velký objem dat, které UCSB sdružuje, jsou děleny dle NAICS struktury a kódů.
NAICS struktura
NAICS struktura je dělena do hierarchického vztahu:
V NAICS struktuře je zahrnuto 20 sektorů. Až na sektory 11 a 92 (viz níže) jsou zahrnuty do ekonomického sčítání.
Obrázek 2: NAICS struktura odvětví; zdroj: census.gov
Vládní instituce nejsou do ekonomického sčítání obvykle zahrnuty, i když bude jejich primární provoz klasifikován v průmyslových odvětvích zahrnutých do ekonomického sčítání. Údaje o sčítání lidu z průmyslových odvětví v několika odvětvích se mohou v důsledku těchto výluk zdát neúplné. Zároveň byly z hospodářského sčítání vyloučeny některé oficiální operace:
Nemocnice
Vládní obchody s lihovinami
Vydavatelé univerzitního tisku
Federální rezervní banky
Existuje samostatné sčítání vlád, které poskytuje některé údaje o příjmech, výdajích a zaměstnanosti pro různé vládní funkce, jako jsou ulice a dálnice, nakládání s pevným odpadem, kanalizace, elektrická energie, doprava a místní knihovny.
Hledání dat na census.gov
Hledání dat přes census.gov můžeme rozdělit do dvou perspektiv: uživatelské rozhraní a developerské rozhraní přes API. Z uživatelského pohledu je hledání dat velmi jednoduché. Census.gov nabízí dva primární nástroje: QuickFacts a Census Business Builder.
QuickFacts
QuickFacts je uživatelsky přívětivý rámec, který nabízí tabulky, mapy a grafy běžně požadovaných statistik z různých sčítání lidu, průzkumů a služeb. K dispozici jsou profily pro celou zemi, všech 50 států, District of Columbia a Portoriko, stejně jako všechny kraje. Zahrnuty jsou také města a města s počtem obyvatel 5 000 a více.
Uživatel si lehce může zvolit lokalitu a v nabídce rychle zvolit i jednotlivé fakta. Po zadání svého požadavku si uživatel může daná data zobrazit graficky na mapě či v jiném grafickém vyjádření. Zajímavostí pro uživatele může být i vytvoření dashboardu či možnosti sdílení dat přes email či sociální sítě (FB, Twitter). Uživatel si samozřejmě může data vytisknout či stáhnout ve formátu CSV.
Census Business Builder
Census Business Builder (CBB) je kolekce služeb Census Bureau, která poskytuje demografické a ekonomické údaje přizpůsobené konkrétním typům uživatelů ve snadno použitelném formátu. Co si pod tím ale představit? Tento nástroj je speciálně mířen na byznys uživatele, který mají za cíl založit podnik a chtějí získat počáteční data pro svoje rozhodování. CBB na základě lokace a odvětví či NAICS kódu uživateli přípraví report, který je dělen do několika částí:
Potenciální zákazníci
demografická analýza
socioekonomická analýza
ostatní relevantní analýzy
Analýza daného sektoru v dané lokalitě
Analýza spotřebitelských výdajů
Ostatní (liší se dle uživatelských vstupů při hledání)
Níže jako příklad uvádím část reportu pro tyto zadané vstupy: odvětví – komerční nemovitosti, lokalita – Oklahoma City.
Census Data Application Programming Interface (API) je datová služba, která umožňuje vývojářům softwaru přistupovat a používat data Census Bureau v rámci svých aplikací. Toto API používají výzkumní pracovníci a vývojáři aplikací v rámci Census Bureau i mimo něj. Jeho jednoduchý nezpracovaný formát usnadňuje a zpřístupňuje zadávání dat v jakémkoli formátu, který uživatelé potřebují pro prezentaci a manipulaci s daty. Census Data API je rychlý a snadný způsob dotazování dat přímo ze serverů Census Bureau a přináší řadu výhod:
Snadné stahování cílových proměnných a geografických oblastí
Připojuje se ke statistickým nástrojům, jako jsou R a SAS
Poskytuje okamžitý přístup k nejnovějším datům
Usnadňuje vytváření inovativních mobilních a webových aplikací
Vytváří vizualizace dat
Census Bureau již zpřístupnilo většinu svých datasetů a přidává na měsíční bázi další. Mezi nejčastěji využívané patří:
American Community Surveys (ACS)
Časové řady ekonomických ukazatelů
Desetileté sčítání lidu
Ekonomické sčítání lidu
Odhady populace a projekce
Mezinárodní obchod
Kompletní list dostupných datasetů lze najít přes tzv. API Discovery Tool.
Obrázek 5: Rozhraní API Discovery Tool; zdroj: api.census.gov
Queries fungují na stejné bázi jako jakékoliv jiné informační zdroje. Census Bureau používá nestandardní verzi JSON, kde data jsou reprezentovány v dvourozměrném poli, hranaté závorky („[]“) obsahují pole a hodnoty jsou odděleny čárkou. Viz příklad níže:
Klíčové pojmy důležité pro práci s API Census Bureau
Proměnné
Každá jednotka dat, kterou uživatel hledá v datové sadě, se označuje jako proměnná. Každá proměnná v datové sadě má název, který může být sám o sobě zkratkou nebo něčím smysluplným, například STNAME, POP nebo DATE_.
Povinné proměnné
Povinné proměnné jsou parametry, které uživatel musí zahrnout do vyhledávání; v opačném případě jeho vyhledávání neprodukuje žádná data a vrátí chybovou zprávu.
Atributy
Další proměnné, které může uživatel použít při volání API k poskytnutí dalších podrobností o primární proměnné, se nazývají atributy. Lze zahrnout například štítky, poznámky, meze chyby, statistickou významnost apod.
Get Funkce
Funkce get (get =) určuje požadované a vybrané proměnné, které od API žádá uživatel.
Predikáty
Uživatel může vytvořit predikáty pro geografii, string proměnné, číselné proměnné a čas; a všechny určují, jak by měly být proměnné filtrovány nebo omezovány (v souborech dat časové řady).
Group Funkce
Funkce group umožní uživatelovi získat výsledky pro celou tabulku v jediném příkazu.
Využití dat
Jak už je zřejmé z dosavadního textu, tak census.gov poskytují podrobné statistiky, které jsou nesmírně důležité pro průmyslová odvětví a komunity. Obchodní sdružení, obchodní komory a podniky spoléhají na tyto informace pro ekonomický rozvoj, obchodní rozhodnutí a strategické plánování.
Obrázek 7: Znázornění možností využití dat z census.gov; zdroj: census.gov
Reálné příklady využití v praxi
Na webu census.gov lze najít sekci „Real-Life Use Cases“, kde je shrnuto šest reálných příkladů využití poskytnutých dat. Níže uvádím tři vybrané příklady:
1. Přehodnocení stávajícího většího podniku – výrobce užitkových vozů
Výrobce užitkových nákladních vozidel pravidelně přezkoumával svou síť prodejců a opravárenských zařízení po celých USA. Byli rádi, že většina jejich zařízení vykázala vysoké skóre spokojenosti zákazníků z průzkumů, které provedli se svými zákazníky, ale byli zklamáni, když viděli, že někteří nedělali tak dobře. Počty podniků (instalatérské a elektroinstalační firmy), které obvykle používaly svá vozidla v oblastech pokrytých službami, byly zjištěny (na mapě) pomocí obchodních údajů ze sčítání lidu. Nahoře překryli mapu svých servisních středisek a odhalili oblasti s mnoha potenciálními zákazníky. Také si všimli, že některé oblasti služeb jejich zařízení s nedostatečným výkonem se překrývaly s jinými oblastmi. Pracovníci plánování dokázali přesvědčit manažery, že je třeba zlepšit podnikové procesy pomocí údajů ze sčítání. Aby lépe sloužili svým trhům, dohodli se, že některá zařízení by měla být přesunuta a měla by být otevřena nová zařízení. Hodnocení spokojenosti zákazníků se dramaticky zvýšilo v době, kdy byla dokončena další roční analýza.
2. Formování daňové politiky – daně z cigaret v Marylandu
Stát Maryland zvažoval zvýšení daní z cigaret a jiných tabákových výrobků. Stát se obával nejen dopadu na spotřebitele tabákových výrobků (a toho, jak by toto zvýšení mohlo ovlivnit schopnost zákazníka je koupit), ale také dopadu na společnosti, které prodávají tabákové výrobky ve státě. Státní zaměstnanci použili údaje o produktových řadách z ekonomického sčítání ke klasifikaci typů dotčených podniků a ke stanovení rozsahu účinků. Tato čísla odhalila, že obchody s potravinami jsou nejoblíbenějšími prodejci tabákových výrobků v Marylandu, což představuje 18,1 procenta (121,2 milionu USD) z celkového prodeje. S využitím údajů Census Bureau o velikosti firmy zjistili, že drtivá většina obchodů s potravinami zaměstnává méně než pět lidí. Po studii údajů se státní úředníci rozhodli nezvýšit tyto daně kvůli možným negativním dopadům na malé podniky.
3. Otevření nové malé firmy – prodejna kol v Portlandu v Oregonu
Úspěšný špičkový výrobce komponentů pro horská kola zvažoval otevření vlastního obchodu s jízdními koly, aby mohl prodávat své výrobky i horská kola a další příslušenství. Identifikoval potenciální zákazníky (mladé profesionály se středním až vysokým středním příjmem domácnosti) pomocí údajů z průzkumu ACS. Použil údaje ze sčítání, aby určil umístění obchodů se sportovními potřebami (NAICS 451110, který zahrnuje obchody s jízdními koly). Tato zjištění nejen zavedla potenciální konkurenty pro jeho společnost, ale také podniky, se kterými mohl spolupracovat otevřením pronajatého oddělení ve větším obchodě. Byl také schopen porovnat mezd na zaměstnance, výnosy na zaměstnance a další statistiky pro devět oblastí, které zvažoval, pomocí statistik trhu ze sčítání lidu, což mu poskytlo lepší pochopení jeho oboru a toho, co by měl očekávat od svých zaměstnanců. Tyto údaje byly použity v jeho podnikatelském plánu a žádosti o půjčku na počáteční kapitál, kterou předložil místnímu věřiteli pro malé podniky.
Závěr
Census.gov je nesmírně důležitý web nejen pro jednotlivé uživatele v US či v zahraničí, ale i pro další externí informační zdroje, které spoléhají na tyto data. Posláním Úřadu pro sčítání lidu je sloužit jako přední poskytovatel kvalitních údajů o svých lidech a ekonomice. Pro jednotlivé uživatele může být tento informační zdroj zajímavý zejména svojí jednoduchostí a vytvářením specifických dashboardů či reportů přes poskytované nástroje.
Nad fundamenty portálu census.gov lze pohlížet z české perspektivy jako nad CZSO, nicméně oba portály se ve výsledné podobě poskytovaných informací mírně liší. Např. CZSO nenabízí souhrnné specifické reporty pro podnikatele dle lokality a odvětví, ale nabízí jiný typ reportů (např. statistický bulletin dle kraje).
Zdroje
UNITED STATES CENSUS BUREAU. Census Data API User Guide. Census.gov [online]. United States Census Bureau, 2021 [cit. 2021-5-8]. Dostupné z: https://www.census.gov/content/dam/Census/data/developers/api-user-guide/api-guide.pdf
UNITED STATES CENSUS BUREAU. Guidance for Economic Census Data Users [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/programs-surveys/economic-census/guidance.html
UNITED STATES CENSUS BUREAU. QuickFacts [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/quickfacts/
UNITED STATES CENSUS BUREAU. Census Business Builder [online]. [cit. 2021-5-8]. Dostupné z: https://cbb.census.gov/
V dnešnej dobe, ktorá poskytuje množstvo dostupných informácií je čím ďalej náročnejšie orientovať sa, ktoré zdroje na získavanie informácii je potreba si zvoliť. S neustále narastajúcimi zdrojmi, ktoré internet poskytuje je časovo náročné vybrať si práve tie zdroje, ktoré budú obsahovať presne informácie, ktoré potrebujeme a ich vypovedajúca hodnota je pravdivá.
Informačný zdroj data.gouv.fr
Tento post popisuje platformu slúžiacu na šírenie verejných údajov francúzskeho štátu „data.gouv.fr“, ktorej prvá verzia bola vyvinutá agentúrou Logica pod vedením predsedu vlády Francoisa Fillona a spustená 5.12.2011. V decembri 2013 bola spustená druhá verzia spoločnosťou Etalab.
Nové stránky sú však už vyvíjané interne, založené na bezplatnom softvéri „Comprehensive Knowledge Archive Network“ (CKAN) vyvinutom prostredníctvom Open Knowledge Foundation. Od roku 2014 je stránka vyvíjaná na špecifickom softvéri s názvom udata. Zdrojový kód softvéru uData je publikovaný na serveri Github a sprístupnený pod GNU Affero General Public License.
Stránka je síce vo francúzskom jazyku a však je možné hore v záložke zmeniť jazyk na angličtinu.
Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor]
Vyhľadávanie v repozitári data.gouv.fr
Vyhľadávať požadované informácie v repozitári data.gouv.fr je možné viacerými spôsobmi.
1. Vyhľadávanie pomocou políčka Search, ktoré nám ponúkne najpopulárnejšie data-sety, reuses a organizations, ktoré sa týkajú kľúčového slova, ktoré sme zadali. Ukážeme si to na príklade slova „COVID“.
Obrázok 2: Úvodná stránka data.gouv.fr vyhľadávanie v repozitári pomocou Search [zdroj obrázku: autor]
2. Vyhľadávanie pomocou Data-Setov v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné data-sety, ku dňu 8.5.2021 dostupných 36 885, z repozitára, ktoré si vieme následne zoradiť na základe nasledujúcich kritérií:
Dátum vytvorenia
Množstvo odberateľov
Naposledy modifikované
Množstvo prepoužití
Titul
Po výbere kritérií si vieme zvoliť zoradenie od maxima po minimum alebo naopak. Na danej záložke je možnosť exportu data-setov alebo zdrojov podľa potreby do formátu csv.
V danej sekcii je taktiež možné data-sety filtrovať na základe nasledujúcich filtračných podmienok:
Organizácií
Badges
Tags
Licencií
Časového pokrytia
Priestorového pokrytia
Teritoriálnej granularity
Formátov
Podľa frekvencii prepužití
Aby sme správne porozumeli čo sa pod danými filtračnými podmienkami skrýva uvedieme si 5 najčastejšie používaných hodnôt pre jednotlivé filtračné podmienky. Tieto hodnoty vrátane filtračných podmienok ponecháme v anglickom jazyku aby nedošlo k zmene vypovedajúcej hodnoty kvôli nepresnému prekladu. V tabuľke budú taktiež znázornené počty data-setov, ktoré budú zobrazené po zafiltrovaní.
Organizations
Values
Counts
Departmental Directorate of the Cher Territories
1017
Departmental Directorate of Territories and the Sea of the Somme
999
Departmental Directorate of Ariège Territories
908
Ile-de-France region
883
Datalocal resource center
759
Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor]
Badges
Values
Counts
C³
361
Openfield 16
96
Nec Mergitur
54
Base Local Address
12
Reference Data
9
Tabuľka 2: Filtrovanie podľa Badges [zdroj tabuľky: autor]
Tags
Values
Counts
open-data
15810
gateway-inspires
15727
geoscientific-information
5164
cadastral planning
5018
land-use
4641
Tabuľka 3: Filtrovanie podľa Tags [zdroj tabuľky: autor]
Licenses
Values
Counts
Open License / Open License version 2.0
22857
Open License / Open License
5448
Open Data Commons Open Database License
3758
License Not Specified
3257
Other (Attribution)
136
Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor]
Temporal coverage
Values
Counts
From 01/01/0199
N/A
Till 12/31/2108
N/A
Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor]
Territorial granularity
Values
Counts
Other
17374
French town
1564
Country
924
French country
600
French intermunicipal (EPCI)
556
Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor]
Formats
Values
Counts
json
24391
shp
20256
csv
15126
zip
13824
document
4988
Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor]
Known reuses
Values
Counts
Never reused
32204
Little reused
1301
Quite reused
80
Heavily reused
56
Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor]
Spatial coverage
Values
Counts
World
7092
European Union
7005
France
6959
Metropilitan France
3674
Occitania
1011
Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor]
3. Vyhľadávanie pomocou Reuses v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné reuses, ku dňu 8.5.2021 dostupných 2 654, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre data-sety kritériá navyše doplnené o data-sety. Reuses taktiež zobrazujú z koľkých data-setov sú zhotovené.
Rovnako ako aj pre data-sety aj reuses vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:
Organizations
Badges
Type
Tags
Datasets
Followers
4. Vyhľadávanie pomocou Organizations v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné organizácie, ku dňu 8.5.2021 dostupných 2 816, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre reuses kritériá doplnené o reuses.
Rovnako ako aj pre reuses aj organizations vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:
Datasets
Badges
Reuses
Followers
Ďalšími dostupnými zdrojmi dát, ktoré je možné využiť v rámci data.gouv.fr sú nasledujúce dokumentácie:
Technické dokumentácie dostupné na: https://doc.data.gouv.fr/
Open data guides dostupné na: https://guides.etalab.gouv.fr/
Pre prehľadnosť je možné využiť dashboard:
Obrázok 3: Dashboard pre data.gouv.fr [zdroj obrázku: autor]
Pridávanie do repozitára data.gouv.fr
Webový portál neslúži len na dohľadávanie informácií ale taktiež umožnuje informácie nahrávať. Nahrávanie je možné už hore zmienených datasetov, reuses a organizácií .
Obrázok 4: Nahrávanie dát do data.gouv.fr [zdroj obrázku: autor]
Podmienkou nahrávania informácii je však registrácia a následné prihlásenie na webový portál.
Závěr
Webový portál data.gouv.fr je globálny register, ktorý obsahuje primárne dáta týkajúce sa francúzska ako krajiny. Ucelené oblasti informácií, ktoré chceme dohľadať vieme pekne filtrovať na základe datasetov a zoradiť si ich podľa potreby. Jedná sa o otvorenú platformu pre francúzske verejné informácie. Na príklade môžeme vidieť, že množstvo aktuálne publikovaných informácii alebo čerstvo pridávaných informácií sa týka najmä COVID problematiky a dopadmi, ktoré na Francúzsko táto pandémia má. Cieľom data.gouv.fr však nie je poskytnúť informácie len občanom francúzska ale rovnako aj ostatným užívateľom, ktorí sa chcú dozvedieť viac, či už o politických záležitostiach francúzska ale rovnako aj kultúre, ekonomike, práve, transporte alebo ostatných oblastí týkajúcich sa francúzska obsiahnutých vo viac ako 36 000 datasetov.
Zdroje
[1] data.gouv.fr – Registry of Research Data Repositories [online]. [cit. 8.05.2021]. Dostupné z: https://www.data.gouv.fr/en/
Krajiny silne závislé na príjmoch z odvetvia cestovného ruchu dnes čelia náročným chvíľam. COVID-19 spustil jednu z najväčších hospodárskych kríz, akú kedy svet zažil. Európska komisia preto zintenzívnila svoju podporu sektora cestovného ruchu a širokej verejnosti poskytla príležitosti na objavovanie rozmanitej kultúry a prírody krajín v rámci Európy. [1]
Sprístupnenie kultúrneho dedičstva Európy verejnosti dnes napomáha v rade spôsobov a miest, kde sa spoločnosť k cestovaniu nemôže a nedokáže dostať. Požívatelia portálu Europeana sú odľahčení od prekážok reality a s pokojom skúmajú významné kultúrne miesta, objekty, umelecké diela a príbehy viažuce sa k európskym krajinám. [2]
Portál Europeana spája ľudí rôznych kultúr či generácií tým, že im pomáha zdieľať ich osobné príbehy viažuce sa k udalostiam ako 1. svetová vojna, Pád železnej opony r. 1989 a i.. Pôvodné príbehy v kombinácii so známymi historickými rozpravami a faktami združujú spomienky osôb s bohatou európskou históriou pod jednou strechou. K dnešnému dňu bolo zozbieraných 50 000 objektov a príbehov týkajúcich sa 1. svetovej vojny. [2]
1. Europeana
Europeana aktívne podporuje online dostupnosť kultúrneho dedičstva a jeho opätovné využitie dnes už takmer 14. rok. Tvrdá práca v súčasnosti prináša svoje zrelé ovocie v podobe viac ako 58 miliónov zdigitalizovaných kultúrnych predmetov z 3 700 knižníc, archívov, múzeí a zbierok. Obsahová stránka portálu odráža európske dejiny z pravekej histórie až k súčasnosti pokrývajúc rôzne témy z umenia a módy až k fotografii a športu počnúc. Portál Europeana poskytuje svoje služby bezplatne a medzi jej primárnych používateľov radíme učiteľov spolu so študentmi. Základnú štruktúru portálu zachytáva obrázok 1. [1] [3]
Obrázok 1: Základná štruktúra portálu Europeana [2]
1.1 3D obsah portálu
Portál disponuje obvyklým textovým či grafickým obsahom a svojim používateľom tiež ponúka audio či video záznamy. Osoba je v ňom dokonca schopná dohľadať 3D reprezentáciu historickej pevnosti či objektu, viď obrázok 2.
Obrázok 2: 4D reprezentácia pevnosti The Peñíscola Castle [4]
Zobrazenie 3D modelu dokáže používateľ upravovať na základe svojich osobných preferencií. Okrem základných funkcionalít nastavenia akými sú priblíženie, oddialenie a 360° otáčanie mu portál Europeana ponúka detailnú ukážku miestností, ktorou pevnosť The Peñíscola Castle disponuje. Po zvolení niektorého z číselných indexov sa 3D ukážka automaticky zameria na vybranú časť pevnosti. Používateľ tak dokáže vstrebať aj tie najmenšie detaily, ktorými historická stavba dominuje. Prehliadku pevnosti sprevádza tiež zvukový komentár objasňujúci k čomu daná miestnosť označená číselným indexom v minulosti slúžila. Portál Europeana disponuje hneď niekoľkými jazykovými variantami, v ktorých si osoba môže historický výklad vypočuť. UI prostredie takéhoto štýlu získavania informácií zobrazujú obrázky 3-4.
Obrázok 3: Detail pevnosti označený č. indexom 7 [4]
Obrázok 4: Detail miestnosti označený č. indexom 16 [4]
Každý nájdený objekt je okrem vizuálnej či zvukovej ukážky doplnený o základný popis hlavných faktov, ktoré používateľa môžu zaujímať, viď obrázok 5. Výsledky hľadania majú tiež presne špecifikované pravidlá ich zdieľania a opätovného použitia.
Obrázok 5: Základný popis pevnosti The Peñíscola Castle [4]
Jeden príkaz – mnoho výsledkov, aj týmto štýlom možno opísať portál Europeana. Osoba zameraná na konkrétnu tematiku je schopná získať obsiahle informácie o mnohých objektoch v krátkom časovom úseku, vďaka automatizovanému procesu hľadania, viď obrázok 6.
Obrázok 6: Rýchly proces hľadania objektov spadajúcich pod jednu tematiku [4]
Portál Europeana dopĺňa výsledky hľadania o detailnú charakteristiku ich technických či historických metadát. V prípade pevnosti The Peñíscola Castle sú uvedené informácie o časovom období, dátume vytvorenia digitálnej podoby objektu či proveniencie, viď obrázok 7.
Obrázok 7: Detailné metadáta nájdeného objektu [4]
V neposlednom rade je používateľovi umožnené mapové zobrazenie nájdeného objektu s presnými zemepisnými súradnicami, viď obrázok 8.
Obrázok 8: Mapové zobrazenie nájdeného objektu [4]
1.2 Textový obsah portálu
Textový obsah portálu Europeana je vo veľkej miere zastúpený novinovou tlačou. Používateľovi je sprístupnené filtrovanie možností hľadania výsledkov podľa požadovaného dátumu či jazyka, viac v kapitole 1.4. Reálnu ukážku nemeckej tlače z apríla r. 1881 zobrazujú prílohy obrázok 9-10. V ľavom bočnom panely sa používateľovi automaticky zobrazí anotačný blok, ktorý mu zľahčuje orientáciu v tlačenom texte novín. Osoba môže voľne listovať stránkami tlače a ich vizuálnu ukážku prispôsobovať vlastným preferenciám. V prípade, že osoba pátra po špecifickom výraze, je možné proces hľadania drasticky skrátiť a miesto prechádzania naprieč všetkými stranami novín je možné hľadaný výraz vložiť do textového poľa, ktoré automaticky zobrazí nájdené výsledky, ak je hľadaný pojem v tisku prítomný. Praktickú ukážku znázorňuje príloha obrázok 10, kde dochádza k hľadaniu nemeckého pojmu „Anzeige“ naprieč novinovým textom.
Obrázok 9:Nemecký tisk z apríla r. 1881 [5]
Obrázok 10: Výsledky hľadania pojmu „Anzeige“ naprieč novinami [5]
Obdobne ako tomu je vo vyššie uvedenom príklade hľadania 3D objektu pevnosti The Peñíscola Castle, aj v prípade textového obsahu portál Europeana zaznamenáva detailnú charakteristiku metadát, akou je napr. jazyk novinového výtlačku, rozsah či dátum vydania, viď obrázok 11.
Obrázok 11:Detailné metadáta nájdeného objektu [5]
1.3 Video, Audio obsah portálu
Video či audio záznamy sú v portáli Europeana zastúpené v početnom množstve rôznych tematík, počnúc od hudobných koncertov až po záznamy z 1. svetovej vojny. Súčasťou portálu je tiež integrovaný video/audio prehrávač, ktorý používateľom zaručuje pohodlné prezeranie výsledkov hľadania. Obrázkové prílohy 12-13 slúžia ako ukážka video záznamu z obdobia 1. svetovej vojny na území bývalého ČSR. Obrázok 12 obsahuje zoznam kľúčových slov, pod ktorým je možné dané video nájsť. Naopak obrázok 13 reprezentuje metadáta, ktoré v prípade video záznamu uvádzajú jazyk a produkčnú krajinu filmu, dátum vytvorenia a miesto udalosti.
Obrázok 12: Ukážka video záznamu z obdobia 1. svetovej vojny [6]
Obrázok 13: Detailné metadáta nájdeného objektu [6]
1.4 Prehľadávanie portálu
Používateľ je na portáli Europeana schopný prezerať všetky položky rôzneho druhu ešte skôr než začne s procesom vyhľadávania informácií. Portál Europeana dáta kategorizuje do piatich typov: [7]
Text: knihy, listy, archívne papiere, dizertačné práce, básne, novinové články, faksimile, rukopisy a hudobné podklady
Obrázky: obrazy, kresby, výtlačky, fotografie, obrázky múzejných objektov, mapy, grafických vzorov, plánov a hudobného notácie
Video: filmy a televízne programy
Zvuk: pásky, disky a rozhlasové vysielania
3D: virtuálne 3D reprezentácie objektov architektúry alebo miest
UI prostredie portálu je dostatočne intuitívne a logické. Osobám poskytuje prehľad o zastúpenom type médií vo vybranej zbierke (Art, Fashion, Sport a i.), možnostiach opätovného použitia nájdených výsledkov pre osobné účely či aktuálne počty objektov vo zvolených kategóriách. Obrázky 14-16 znázorňujú proces prehľadávania objektov v zbierke Arts.
Obrázok 14: Proces prehľadávania objektov – filtrovanie podľa typu média [8]
Obrázok 15: Proces prehľadávania objektov – filtrovanie podľa opätovného použitia [8]
Obrázok 16: Proces prehľadávania objektov – filtrovanie podľa krajiny [8]
V kapitole 1.2 zaoberajúcou sa textovým obsahom portálu je uvedený príklad nemeckej tlače z apríla r. 1881. V prípade, kde osoba hľadá špecifický dátum vydania je možné využiť rozšírenú ponuku filtrovania výsledkov, a to spôsobom zadania konkrétneho dátumu či iných osobných preferencií, ako znázorňuje príloha na obrázku 17.
Obrázok 17: Rozšírené prehľadávanie objektov na základe osobných preferencií [9]
1.5 Vyhľadávanie v portáli
Portál Europeana disponuje priamym spôsobom získavania nových informácií. V prípade, kde osoba pozná predmet svojho hľadania sa ponúka použiť nasledovný princíp: [7]
Who: meno osobyresp. tvorcu. Príkaz „who: Vincent van Gogh“ vyhľadá umelecké diela svetoznámeho maliara. Naopak, týmto štýlom nie sme schopní získať záznamy o jeho osobnom živote.
What: typ položky, predmetu alebo kľúčového slova hľadanej veci. Príkaz „what: Art Nouveau“ zobrazí umelecké diela, budovy a pamiatky Art Nouveu.
Where: názov miesta. Príkaz „where: Milan“ zobrazí objekty, ktorých vznik sa datuje k územiu Milána alebo sa aktuálne v Miláne nachádzajú. Portál Europeana počíta aj s jazykovou diferenciou, a preto v prípade príkazu where: Milano alebo Mailand či Milanas zobrazí používateľovi rovnaké položky viažuce sa k danej geografickej oblasti.
When: dátum. Príkaz „when: 1984“ vyhľadá položky z r. 1984. Obdobným príkazom je „YEAR:1984“ alebo „YEAR:[1525 TO 1527]“, ktorým môžeme vymedziť nami požadované časové obdobie.
1.5.1 Pokročilé vyhľadávanie
Zaužívané techniky pokročilého hľadania sa ničím nelíšia ani na portáli Europeany. Osoba dokáže vyhľadať frázu za pomoci úvodzoviek či využiť známe operátory: [7]
AND: nájde výsledky, ktoré obsahujú všetky zadané slová, napr. salt AND pepper. Operátor je možné nahradiť postupnosťou znakov && alebo +.
OR: nájde výsledky, ktoré obsahujú aspoň jedno zo zadaných slov, napr. salt OR pepper. Operátor je možné nahradiť postupnosťou znakov ||.
NOT: vylučuje výsledky, ktoré obsahujú zadané slovo, napr. salt NOT pepper. Operátor je možné nahradiť znakom – alebo !.
V prípade potreby portál Europeana tiež podporuje funkcionalitu tzv. zgrupovania za pomoci využitia zátvoriek, napr. “(salt AND pepper) AND cooking”.
Ďalšie operátory pokročilého vyhľadávania záznamov, akými sú * alebo ? či ~ sú portálom Europeana podporované v plnom rozsahu: [7]
Operátor *: nájde slová s ľubovoľným počtom písmen, napr. „ca*“ zobrazí položky ako cat, cap, cane, cable, canary a i..
Operátor ?: nahrádza jedno písmeno v zadanom slove, napr. „ca?e“ zobrazí položky ako cane, care, case a i.. Operátor ? nachádza využitie najmä v prípadoch, v ktorých si osoba nie je istá správnosťou pravopisu.
Operátor ~: nájde položky s podobným pravopisom, napr. „text~“ zobrazí položky ako test, texts a i..
1.6 Využitie portálu
Portál Europeana disponuje bohatým obsahom rozličných tematík. Ako už vyššie kapitoly uvádzajú, osoba dokáže získať poznatky z historickej novinovej tlače alebo si svoje vedomosti prehĺbiť v starovekých pevnostiach. Okrem iného však portál tiež uchováva archívne zábery z módnych mól popredných návrhárov, ktorých výsledky používateľ dokáže detailne filtrovať na základe výberu:
Dizajnéra
Typu položky ako haute couture, fashion show, fashion collection či typ odevu/doplnkov/obuvi
Farby
Orientácie obrázka
Veľkosti obrázka
Jazyku
Inštitúcie
Formátu súboru
Osoba má na výber z celkového počtu 43 zbierok rôznych tematík abecedne zoradených. Portál tiež ponúka vyhradenú sekciu pre pedagógov, študentov či rodičov, ktorá disponuje selekciou overených vzdelávacích zdrojov pravidelne aktualizovaných na základe diania vo svete.
Naše kultúrne dedičstvo spája minulosť, súčasnosť a budúcnosť. Na podporu cestovného ruchu, EÚ preto vyhradila na portáli Europeana osobitnú časť: Discovering Europe , ktorá používateľa prevedie virtuálnou cestou po Európe z pohodlia jeho domova. [1]
Posledné výskumy uvádzajú zistenie, až 40% turistov si dnes vyberá svoju dovolenkovú destináciu na základe jej kultúrneho dedičstva a histórie. [1]
Společnost MarineTraffic (2021a) je světový leader v poskytování informací o poloze plavidel a námořním zpravodajství. Společnost si dává za cíl zjednodušit přístup k užitečným datum.
Obr. 1 Logo společnosti MarineTraffic(2019)
Hlavní přidaná hodnota, kterou společnost vytváří spočívá v monitorování pohybu plavidel. MarineTraffic staví svůj úspěch na sběru dat ze celé sítě pobřežních přijímačů AIS1 doplněných informace ze satelitů. Takto sesbíraná data jsou zpracována a integrují informace z dalších komplementárních zdrojů. Cílem je poskytnout užitečné informace o lodních aktivitách, které jsou aplikovatelné v zasilatelském, obchodním a logistickém průmyslu.
Hlavní kanceláře společnosti se nacházejí v Spojeném království, Řecku a Singapuru. Společnost má také lokální zastoupení u všech hlavních globálních námořních uzlů, tak aby mohla poskytovat služby na míru lokálních požadavků. MarineTraffic prohlašuje, že je skutečně globálním hráčem s miliony uživatelů jeho služeb.
MarineTraffic se dává za cíl poskytovat transparentní informace a pozitivním způsobem posouvat svět námořní dopravy kupředu. Proto společnost spolupracuje s mezinárodními námořními organizacemi jako je například UNCTAD2. Kromě toho MarineTraffic významně spolupracuje s největšími přístavy a rejdařstvími na světě s cílem zlepšit jejich efektivitu.
Na Wikipedii (2020a) heslo MarineTraffic popisuje otevřený komunitní projekt, poskytující informace o pohybech plavidel v reálném čase. Služba byla spuštěna v roce 2007 jako akademický projekt na Egejské univerzitě v Řecku pod vedením profesora Dimitriase Lekkase. Služba je lokalizovaná do 35 jazyků včetně češtiny.
Databáze tohoto projektu obsahuje informace o plavidlech včetně jejich aktuální i historické polohy, rozměry, tonáž nebo například číslo IMO3. Kromě toho mohou uživatelé sdílet fotografie těchto plavidel a navzájem si tyto fotografie hodnotit. Databáze pro finální prezentaci využívá kombinované mapové podklady složené ze služeb Google Maps API a OpenStreetMap.
Základní služba sledování plavidel je poskytována zdarma a zejména pro profesionály jsou nabízený placené prémiové služby. Wikipedické heslo uvádí 600 000 registrovaných uživatelů k roku 2015, ale celkově služba eviduje 2 000 000 unikátních uživatelů měsíčně. Služba je také dostupná formou aplikace pro mobilní zařízení s operačními systémy iOS a Android. (MarineTraffic 2021d)
Jak již bylo zmíněno výše, tak MarineTraffic využívá služby pobřežních AIS přijímačů. Wikipedie dále upřesňuje, že těchto je ve více než 140 zemích světa celkově více než 18 000 přijímačů, a které jsou spravovány dobrovolníky zapojenými do tohoto projektu. Což činní službu velmi závislou na své komunitě. K 27.3.2021 databáze evidovala pohyby 224 533 plavidel během posledních 24 hodin. Protože se má projekt akademické kořeny tak se společnost MarineTraffic kromě rozvoje samotné služby významně věnuje také výzkumu včetně publikování ve spolupráci s univerzitami. Věnuje se zejména oblastem databázových systémů a AI. (MarineTraffic 2021f)
Rešeršní možnosti
Celý produkt této společnost lze rozdělit na dvě velké části, které následně rozlišují takým způsobem lze v této databázi vyhledávat. Těmito dvěma částmi jsou Online services a Data services, přesněji API4 rozhraní k celé databázi. Přesněji Online services nabízejí uživatelsky přívětivé rozhraní, skrze které se lze dotazovat, analyzovat či vizualizovat podkladová data obsažené v Data services. Omezená funkcionalita Online services je nabízena zdarma, avšak přístup k ryzím datům skrze Data services je kompletně zpoplatněn.
V rámci seznámení se MarineTraffic neměl autor této práce možnost si prakticky otestovat práci s Data services. Přesto lze předpokládat že jsou touto cestou zpřístupněny všechny informace obsažené v databázi, a to včetně těch které nejsou jinak zpřístupněny skrze Online services. API rozhraní je primárně cíleno pro byznysové užití. Dle dokumentace, API pomocí HTTP5 protokolu na základě dotazu vrací odpověď ve formátu XML6, CSV7 nebo JSON8.
Obr. 2 ukázka XML odpovědi (MarineTraffic 2021b)
Nyní se však soustřeďme na možnosti vyhledávání pomocí Online services. Na hlavním vstupním bodu webové stránky je uživateli rovnou prezentována Živá mapa zobrazující informace, které databáze obsahuje k zobrazené oblasti. Tedy všechny plavidla, přístavy či další významné entity které se aktuálně nacházejí v zobrazené lokalitě. Samozřejmě jednotlivé body na mapě lze dále rozkliknout a zobrazit si tak detailní informace k dané entitě.
Obr. 3 ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla (MarineTraffic 2021i)
V rámci Živé mapy lze vyhledávat entity nejen skrze mapu, ale také pomocí vyhledávacího pole. V uživatelské nápovědě jsem nenalezl informaci, že vyhledávací pole podporovalo jakýkoliv zvláštní vyhledávací syntax či operátory. Uživatelské rozhraní nabízí pouze filtrování výsledků tyto skupiny entit:
Plavidla
Přístavy
Oblasti
Moje flotila
Moje poznámky
Společnosti
Stanice
Majáky
IMO
MMSI9
Fotografové
Zprávy
Obr. 4 ukázka uživatelského rozhraní pokročilého vyhledávání (MarineTraffic 2021h)
Online services nabízejí k vyhledávání, kromě jednoduchého vyhledávacího pole v rámci Živé mapy, pokročilé vyhledávání Explore, kde lze vyhledávat pomocí velkého množství parametrů které databáze eviduje. Kvantitativní parametry lze dále omezovat na vybrané intervaly a kvalitativní parametry zase pomocí operátorů in a not in. Případně lze kombinovat vyhledávaní pomocí vícero parametrů současně. Pokročilé vyhledávání některých entit je však zpoplatněno a stejně tak je zpoplatněn také jakýkoliv export výsledků vyhledávání.
Popis indexu
Typologie dat jsou zde popsány dle členění datasetů nabízených v rámci Data services. Jedná o pět hlavních kategorií, které se dále dělí na 25 skupin, datasetů. (MarineTraffic 2021c)
První kategorie řeší problematiku určení přesné polohy plavidel a obsahuje následující data sety:
Historická trasa plavidla
Pozice plavidel ve statické flotile
Pozice plavidel ve dynamické flotile
Pozice plavidla v přístavu
Pozice plavidla ve vybraných oblastech
Pozice plavidla ve vlastní oblasti
Aktuální pozice plavidla
Druhá kategorie je věnována informačním zprávám a událostem. Plavidla jsou povinna veřejně hlásit určité události. Tato kategorie obsahuje následující data sety:
Volání přístavu (zejména informace o vstupu a opuštění přístavu plavidlem)
Události plavidla (všechny události s vazbou ke konkrétnímu plavidlu)
Volání kotviště (obdoba volání přístavu, ale pro spravovaná kotviště)
Kategorie Data plavidel je věnována detailním informacím a parametrům plavidel:
Fotografie plavidla
Parametry plavidla
Vyhledání plavidla (vrací URI10 plavidla v rámci databáze MarineTraffic)
Čtvrtá kategorie je věnována plánování plavby:
Předpověď cesty (vrací očekávané průjezdní body, vzdálenosti a čas plavby)
Očekávané příjezdy (vrací seznam plavidel očekávaných v přístavu)
Odhadovaný příjezd (jako Odhadovaná destinace, ale na základě jiného modelu)
Provoz v přístavu (poskytuje informace o čekacích dobách plavidel)
Očekávaný čas příjezdu do přístavu
Poslední kategorie je věnována správě účtů v rámci celého produktu MarineTraffic:
Změna flotily
Plavidla ve flotile
Flotily
Zůstatek kreditů
Vyprázdnění flotily
Přístup ke všem data setům je zpoplatněn. Přístup lze platit většinou dvěma způsoby. Prvním je kreditový systém, který je dostupný pouze u některých datasetů. Uživatelé si mohou pořídit určitý obnos kreditů které lze následně utrácet za vybrané dotazy skrze API rozhraní. Různé dotazy mohou mít různou cenu. Cenu ovlivňuje volba zdroje, zda se jedná o data ze satelitní sítě AIS nebo ze sítě pobřežních přijímačů AIS. Druhou možností je předplatné, které je dostupné u všech datasetů. Pořízení předplatného je však komplikovanější vzhledem k tomu že je potřeba napřímo kontaktovat poskytovatele. Vždy se jedná o individuální nabídku, a nikoliv službu s předem stanovenou cenou.
Databáze eviduje pozice pohybujících se plavidel v 2 minutových intervalech. U nehybných plavidel je evidována jejich poloha jen každých 20 minut. Databáze sbírá data primárně ze dvou zdrojů. Jak již bylo zmíněno jedním je satelitní přijímače AIS vysílání a tím druhým je pobřežní sít přijímačů AIS vysílání. MarineTraffic vybudoval s pomocí své komunity největší síť přijímačů AIS vysílání na světě. Jednotlivci jsou motivováni k tomu, aby se do této komunity zapojili dvěma způsoby. Prvním je že současní vlastníci AIS přijímačů, kteří se zapojí do této sítě zdarma obdrží navýšení jejich úrovně předplatného služeb MarineTraffic. Naopak těm, kteří nemají AIS přijímač, jsou oblasti, která doposud není dostatečně pokrytá, těm MarineTraffic takový přijímač zdarma poskytne. (MarineTraffic 2021g) Vedlejším zdrojem dat, fotografií, jsou uživatelé–fotografové, kteří je dobrovolně do databáze nahrávají své fotografie konkrétních lodí.
Příklady užití
Pro identifikaci některých příkladů využití služby MarineTraffic byl kontaktován Jan Poláček ze společnosti Czechoslovak Ocean Shipping, s.r.o. přední české zasilatelské společnosti. Společnost využívá placenou variantu služby Online services, ale již nikoliv přímé rozhraní databáze Data services. Pan Poláček oceňuje zejména jednoduchost použití a přehlednost, když prezentuje výstupy z této služby zákazníkům. Využívají polohu plavidel pro sledování zásilek celou dobu cesty a pružně reagovat na případné zpoždění plavidla upravovat návazné články dopravního řetězce zásilky až k zákazníkovi. Není to je příklad námořní dopravy. V současné době existuje trend sledování zásilek i letecké či automobilové dopravě.
Celý projekt MarineTraffic pochází z akademického prostředí. A zde nachází také mnoho příkladů užití. A například i přístup k Data services lze získat za zvýhodněných podmínek pro akademické užití. Data ze služby MarineTraffic mohou posloužit při manažerských studiích jak ukazuje příklad Martina Jančáka (2018) z Katedry logistiky Fakulty podniko-hospodářské Vysoké školy ekonomické v Praze. Dalšími příklady mohou být pro enviromentální programy studium polární námořní trasy okolo Ruska. Nebo vizualizace hustoty námořní dopravy v kaspickém moři pro geopolitická studia. Za poměrně překvapivé lze označit velmi významné lodní spojení Ázerbájdžánu s Turkmenistánem. Akademické uplatnění této služby je velmi široké. To se ukazuje také na to, že s MarineTraffic spolupracuje sedm univerzit a mnoho specializovaných výzkumných organizací. (MarineTraffic 2021e)
Obr. 5 ukázka využití MarineTraffic pro vizualizaci hustoty provozu v Černém a Kaspickém moři
V neposlední řadě je potřeba zmínit také námořníky samotné, kteří mohou využívat služeb MarineTraffic pro plánování tras i pro samotnou navigaci. V rámci skupiny Online services jsou nabízeny služby jako plánovaní trasy upravené o meteorologickou předpověď, služby odesílání důležitých námořních zpráv formou notifikací v mobilní aplikaci, nebo navigování v přístavišti. Opět, toto je jen krátký výpis několika málo užití této služby, kterých je celkově mnohem více.
Závěr
Závěr je věnován kratičkému srovnání se službou, která téměř dvojčetem k MarineTraffic, a která přesto vůbec nekonkuruje. Tou službou je velice populární švédský Flightradar24. Jedná se službu fungující na stejném principu jako MarineTraffic akorát místo lodí, jak název napovídá, sleduje pohyby letadel. Oba projekty vznikli mezi lety 2006 a 2007. Oba staví na volně šířených identifikačních signálech, které snímá komunitní síť přijímačů. A klíčem k úspěchu obou služeb byla právě agregace a přehledná vizualizace těchto signálů. Obě služby nabízí své základní online služby zadarmo, ale nabízí také prémiové služby a placené API rozhraní databáze. Seznam společných rysů pokračuje i dále. Jedná se skutečně dvojčata.
Přijímání, agregování a následné distribuování AIS vysílání lze jednoduše replikovat. Přesto není mnoho konkurenčních řešení, které by nabízeli obdobnou komplexitu a množství informací. Co se ukazuje jako snadno nenapodobitelné je komunita uživatelů a tvůrců obsahu v rámci služby. Možná i proto, z celé variety služeb, je to právě MarineTraffic, který je dostatečně atraktivní pro významné světové instituce, aby s ním chtěli spolupracovat.
Aktuální případ nákladní lodi, která uvízla v Suezském průplavu a zcela zastavila tak jednu z hlavní námořních tras, dále ukázala sílu online aktualizovaných dat. (Splash 24/7 2021) Novináři z celé světa, mimo jiné i skrze MarineTraffic, neuroticky sledovali několik dní, zda se jedna tečka na mapě dala již do pohybu.
Poznámky pod čarou
1. AIS neboli Automatic identification system je systém pro sledování pohybů lodí. AIS vysílač v kombinaci s námořním radarem jsou základní nástroje pro navigovaní a vyhýbání se kolizím. AIS signálů využívá VTS (vessel traffic services) pro řízení provozu v přístavech. (Wikipedia 2021b)
2. UNCTAD neboli United Nations Conference on Trade and Development, česky Konference OSN o obchodu a rozvoji je jednou z odborných organizací OSN. Její programy jsou zaměřeny na rozvoj obchodu, obchodní a celní politiku, surovinovou politiku a rozmach rozvojových zemí a jejich ekonomickou integraci. (Wikipedia 2019)
3. Číslo IMO neboli International Maritime Organization number je unikátní identifikátor plavidel, jejich registrovaných majitelů či správcovský společností. (Wikipedia 2021e)
4. API neboli Application Programming Interface v informatice označuje rozhraní, které umožňuje interagovat vícero systémům či aplikacím mezi sebou. (Wikipedia 2021a)
5. HTTP neboli Hypertext Transfer Protocol je internetový protokol pro komunikaci klientů s webový servery, zejména pomocí hypertextových dokumentů. (Wikipedia 2021d)
6. XML neboli Extensible Markup Language je značkovací jazyk. Je snadno čitelný i strojově spravovatelný. Jedná se o jazyk příbuzný HTML. (Wikipedia 2021h)
7. CSV neboli Comma-separated values je jednoduchý formát zápisu tabulkových dat. (Wikipedia 2021c)
8. JSON neboli JavaScript Object Notation je (Wikipedia 2021f)
9. MMSI neboli Maritime Mobile Service Identity je devítimístné unikátní identifikační číslo všech námořních vysílačů (plavidel i pobřežních stanic). Tento identifikátor je využívám i v rámci AIS. (Wikipedia 2020b)
10. URI neboli Uniform Resource Identifier je textový řetězec, který umožňuje jednoznačně určit umístění a název odkazovaného objektu. (Wikipedia 2021g)
Literatura
JANČÁLEK, Martin, 2018. Dovoz tuňákových výrobků z Latinské Ameriky [online]. B.m. [vid. 2021-03-30]. Vysoká škola ekonomická v Praze. Dostupné z: https://vskp.vse.cz/75733
JSTOR je digitální knihovna původně především pro akademické potřeby v humanitních a společenských vědách. Online databáze umožňuje fulltextové vyhledávání napříč více než 2600 odbornými časopisy, 100 000 e-knihami a miliony primárních zdrojů. JSTOR nabízí velmi kvalitní zdroje, které jsou povinně podrobeny recenzím odborníků z příslušné vědecké oblasti. Díky dobré pověsti a vysoké kvalitě zdrojů se obsah databáze trvale rozšiřuje o nové obory, např. matematiku, statistiku a techniku.
Primárním cílem JSTORu, při prvním spuštění v roce 1994, bylo vyřešení problémů plynoucích z trvalého růstu odborných publikací a nedostatku místa pro archivaci v univerzitních knihovnách. Digitalizace a centralizace textů vytvořila archiv přístupný odborné veřejnosti z téměř celého světa. V roce 2009 se JSTOR stal jedním z nástrojů neziskové organizace Ithaka (více na Ithaka.org).(JSTOR1)
Požadavkem pro zveřejnění odborného časopisu na této platformě je digitalizace kompletní historie časopisu, tedy od prvního vydání prvního svazku. Naopak nárokem ze strany vydavatelů knih a časopisů je „pohyblivá zeď “, která JSTORu umožňuje zveřejnit plný text publikace v databázi až po uplynutí 3-5 let od vydání. (JSTOR 3 nedatováno; JSTOR 2 nedatováno)
JSTOR nabízí mnoho možností, jak získat přístup k obsahu:
Zdarma a bez registrace: omezená část obsahu je k dispozici komukoliv
Zdarma přes školní nebo veřejnou knihovnu
Individuální účet:
funkce organizace a uložení citací nebo poznámek
možnost zdarma přečíst 6 článků každých 30 dní (po dobu pandemie covid-19 je počet článků navýšen na 100)
Neomezená placená verze JPASS pro jednotlivce
Pokud studujete nebo pracujete ve vzdělávací instituci, můžete si individuální účet propojit s účtem Vaší instituce, čímž získáte všechen, Vaší institucí předplácený, obsah z domova. (JSTOR 4 nedatováno)
Základní vyhledávání
Představme si, že jsme v literatuře narazili na jméno Adam Smith a kromě pojmu „neviditelná ruka trhu“ o jeho práci nic neznáme. V takovém případě nám bude stačit základní vyhledávání, které se objeví hned při načtení stránky jstor.org.
JSTOR během zadávání zobrazuje přibližný počet odpovídajících záznamů a navrhuje základní filtrování výsledků. My bychom se rádi seznámili s původní prací Adama Smithe, vybereme proto práce, kde je Adam Smith autorem.
Výsledky hledání lze filtrovat pomocí panelu na levé straně. Prostřednictvím filtrování můžeme omezit výsledky na určitou formu dokumentu, vymezit časový úsek vydání, vybrat relevantní obory prací nebo zobrazit pouze dokumenty, u kterých máme fulltextový přístup. Vyhledávací pole na levém panelu přidává možnost dodatečného vyhledávání v množině dokumentů, kde je autorem Adam Smith. Výsledky vyhledávání jsou ve výchozím nastavení seřazeny dle relevantnosti, ale pomocí tlačítka nad výsledky můžeme řazení změnit na chronologické.
Pokud využíváme individuálního účtu a máme ke konkrétnímu dokumentu plný přístup, můžeme si ho v plném rozsahu přečíst, sdílet, vytvořit citaci, uložit do JSTOR Workspace nebo stáhnout ve formátu pdf.
Pokud máme lepší představu o námi požadované informaci, můžeme využít pokročilé vyhledávání. JSTOR nabízí vytvoření sekvence klíčových slov v rámci polí, kterými jsou autor, titulek, abstrakt a popis obrázku. Pokud takovou oblast nespecifikujeme, proběhne klasické fulltextové vyhledávání. Uživatelsky přívětivá je také nabídka základních operátorů AND, NOT, OR, NEAR/5/10/25.
Pokračujme v příkladu s Adamem Smithem. Po základním hledání jsme zjistily, že angličtina 18. století je nad naše síly, proto už nechceme originální texty. Dále nechceme nic o neviditelné ruce trhu, protože tuto teorii si pamatujeme ze střední školy, a naopak nás zajímá Smith ve spojitosti s volným obchodem. Řekněme, že předmětem našeho zájmu budou knihy v angličtině z aktuálního tisíciletí. Vyhledávací dotaz pro naše kritéria může vypadat například takto:
Poslední dvě pole využijeme, pokud máme detailnější informace a hledáme konkrétní titul. První možností je zadání nazvu knihy, časopisu nebo článku, druhou je jedinečný identifikátor ISBN.
Možnosti vyhledávání pro pokročilé
Pokročilé vyhledávání nám ukázalo, že JSTOR vybízí i začínající uživatele k využívání operátorů. Jakmile si však člověk osvojí základní syntax, může uplatnit efektivní metody i v rámci řádku základního vyhledávání. Díky široké paletě možností dostaneme k dispozici sofistikovanější vyhledávací dotazy.
Co všechno lze tedy využít?
Základní operátory
Uvozovky= pro vyhledání přesné fráze ji vložte do uvozovek (“invisible hand of the market“)
AND = výsledky, která obsahují obě slova (apple AND google)
OR = výsledky, které obsahují jedno nebo obě slova (book OR newspapers)
NOT = výsledky, které neobsahují slovo za operátorem (ink NOT paper)
Závorky = umožňují kombinaci operátorů pro detailní vyhledávání, např. (economy NOT (crisis OR inflation)) vyhledá položky o ekonomice, ale bez zmínek o krizi nebo inflaci
NEAR /5/10/25 = číslice označuje maximální vzdálenost 2 vyhledávaných slov v dokumentu (broom NEAR/10 snitch) (JSTOR 5)
Pokročilé operátory
Podobná slova ~ = přidáním symbolu na konec slova vyhledáme zároveň i obdobně hláskovaná slova, což je vhodné u autorů zahraničních jmen (dostojevksij~) nebo v případě jemných nuancí mezi anglickou a americkou angličtinou (colour~)
Wildcards (? *) = otazník představuje 1 libovolný znak (obdoba žolíka z deskové hry Scrabble) např. wom?n vyhledá woman, women, ale i womqn, pokud se takové slovo v databázi vyskytuje. Na druhou stranu hvězdička je neomezená posloupnost znaků, takže micro* vyhledá microcosmos, mikrobiology, microsoft, microscope atd.
Relevance slov ^ = pomocí ^ upravujeme váhu jednotlivých slov.Dark chocolate^5 znamená, že hledáme informace o hořké čokoládě, ale samotná čokoláda je pro nás pětkrát důležitější (JSTOR 6)
Vyhledávání v polích
Tuto možnost už jsme si vyzkoušeli v pokročilém vyhledáván u Adama Smithe. Rozdílem je, že neklikáme do nabídky polí, ale pro požadované pole píšeme příslušnou zkratku:
au: = autor
ti: = titulek
ca: = popis obrázku
ab: = vyhledá v textu abstraktu
sn: nebo in: = ISSN kód
vo: = číslo svazku
Po osvojení základních zkratek můžeme jít do většího detailu:
la: = vyhledávání pouze konkrétního jazyka (la:eng nebo la:jpn)
ty: = typ dokumentu (ty:fla je dokument v plné délce, ty:brv je recenzí knihy)
cty: = kategorie (cty:chapter pro hledání na úrovni kapitol knih)
(JSTOR 7) (Karlshochschule 2017)
Workspace
Pokud zpracováváme diplomovou práci nebo více odborných prací najednou, uvidíme v nástroji workspace přidanou hodnotu. Pro každý projekt si lze v rámci uživatelského účtu vytvořit složku, do které průběžně ukládáme nalezené použitelné zdroje z JSTORu, ale i různé internetové odkazy mimo naší online knihovnu. Navíc si každou položku můžeme opatřit poznámkami. Při využití zdrojů, nalezených v JSTORu, lze snadno generovat citace pomocí 3 nabízených citačních stylů (MLA, APA a CHICAGO).
Text analyzer je nástroj stále se nacházející v beta verzi, který již nyní skýtá veliký potenciál. Princip spočívá v nahrání dokumentu, obrázku textu nebo URL odkazu na text. Výsledkem vyhledávání je seznam článků na pravé straně, které se věnují obdobné problematice. Nalezené zdroje můžeme filtrovat na levé straně pomocí odebírání rozpoznaných témat a přidáváním témat vlastních nebo identifikovaných v našem textu. Příjemným překvapením je možnost modifikace důležitosti jednotlivých témat. Osobně považuji nastavování vah u jednotlivých témat za skvělý bonus. Jednak jsem schopen efektivněji filtrovat velkým množstvím nalezených textů, ale především si sám lépe uvědomím priority témat, což může být pomocnou rukou při tvorbě obsáhlejšího odborného textu.
JSTOR je respektovaným zdrojem, který v mnoha ohledech předčí běžné odborné knihovny. Studenti zde naleznou zdroje vhodné pro seminární i diplomové práce a odborníci dostatek relevantních informací pro rozšiřování svých obzorů. Veřejnost zase ocení bezplatný přístup k značnému množství odborných článků z širokého spektra oborů. Hlavními přednostmi JSTORu jsou fulltextové vyhledávání a možnost detailního filtrování výsledků. JSTOR se díky všemu výše uvedenému vyvinul ve významný akademický informační zdroj, který jde začátečníkům naproti prostřednictvím uživatelské přívětivosti.
Ohledně využití pro competitive intelligence je překážkou, již dříve zmiňovaná, „pohyblivá zeď“, která posouvá zveřejnění většiny časopisů a e-knih o několik let. Proto není JSTOR vhodný pro vyhledávání nejnovějších událostí ve světě. JSTOR, si ale místo v CI stále najde, zejména v poskytování relevantních informací staršího data, které poslouží k vysvětlení dnešní situace nebo byly prvotním impulsem pro dlouhodobý trend.
Tento článek pojednává o informačním zdroji, který umožňuje vyhledávat ve sbírkách největší světové knihovny a jejím digitalizovaném archivu a umožňuje vyhledávání a přístupu k dalším publikacím, které se nacházejí ve sbírkách spolupracujících institucí.
Informační zdroj Library of Congress
Knihovna Kongresu (Library of Congress) je největší knihovnou světa s více než 170 mil. kusů publikací ve sbírce (Library of Congress, 2021a) a s ročním růstem okolo 2 mil. publikací. Knihovna je Národní knihovnou USA. Slouží tak jako studovna a badatelna. Nachází se ve Washingtonu D.C. v několika hlavních budovách. Další pobočky má po celých Spojených státech a jiných státech světa. (Billington, 2021)
Tento informační zdroj slouží k přístupu ke službám knihovny (vyhledávání, objednávání služeb) a k přístupu k jejímu digitalizovanému obsahu. Obsah knihovny je přístupné zdarma. (Library of Congress, 2021b)
Vyhledávání v Library of Congress
Vyhledávání v katalogu knihovny probíhá několika způsoby. Nejednoduší je zadávání celého vyhledávaného výrazu do vyhledávací řádky. Tento dotaz ovšem bude široky a bude obsahovat také irrelevantní dotazy. Dotaz se dá filtrovat dle typu publikace. Vyhledávání lze vidět na obrázku č. 1.
Obrázek 1: Vyhledávání publikace. (Library of Congress, 2021c)
Vyhledávaný obsah se dá filtrovat, ale nastavování relevantní oblastí nelze nastavit na úrovni dotazů. Filtrování lze vidět na obrázku č. 2.
Obrázek 2: Filtrování při vyhledávání. (Library of Congress, 2021d)
U elektronických a digitalizovaných dokumentů lze jejich obsah zobrazit přímo na monitoru u ostatních periodik dojde k přesměrování na katalog knihovny. U této možnosti (katalog knihovny) jsou rozšířené možnosti vyhledávání a k jejich popsání dojde níže.
Při zobrazení jsou uvedeny informace o publikaci. Jde např. o její název, vydavatele, autora, datum vydání, věcné poznámky k publikaci, či počet stran.
Základní vyhledávání
Ostatní vyhledávání je možné v online katalogu knihovny, ten je přístupný následovně na obrázku č. 3, popř. přes odkaz: https://catalog.loc.gov/.
Obrázek 3: Vyhledávání v katalogu knihovny. (Library of Congress, 2021c)
Zde se přistupuje k vyhledávání následovně (modře základní, červeně pokročilý, zeleně klíčová slova) a lze to vidět na obrázku č. 4.
Obrázek 4: Výběr možnosti vyhledávání. (Library of Congress, 2021e)
Všechny vyhledávání umožnují vyhledávat přes specifikované kategorie. Základní vyhledávání je umožněno přes následující kategorie, které jsou uvedeny níže a je dostupné přes odkaz https://catalog.loc.gov/vwebv/searchBrowse. Ukázku obrazovky pro základní vyhledávání lze vidět na obrázku č. 5.
Obrázek 5: Základní vyhledávání (Library of Congress, 2021f)
Titles: Název publikace
Authors/creators: Autor, vydavatel publikace. Obsahuje dvojí způsob hledání:
obsahuje zadaný řetězec
začíná hledaným řetězcem
Subjects: Hledaná oblast publikace. Obsahuje dvojí způsob hledání:
obsahuje zadaný řetězec
začíná hledaným řetězcem
Names/titles: Hledaný výraz, jméno v textu. Obsahuje dvojí způsob hledání:
obsahuje zadaný řetězec
začíná hledaným řetězcem
Series/uniform titles: Hledaný název řady publikace
CALL NUMBERS: Umístění publikace
LCCN: Identifikátor publikace
V případech, kde vyhledáváme výskyt daného řetězce v textu, pak lze použít tyto zástupné symboly.
% – místo tohoto znaku může být jakýkoliv jeden znak,
? – místo tohoto znaku může být libovolné množství znaků.
Hledaný výraz lze také filtrovat dle:
Roku publikace,
řazení publikace do oblastí (dětské, evropské, americké apod.),
umístění publikace (v jaké knihovně se nachází),
typu publikace (kniha, film),
jazyku,
počtu záznamů na stránce.
Pokročilé vyhledávání
Další možností je pokročilé vyhledávání, které umožňuje spojovat jednotlivé zadané výrazy pomocí logických spojek. Vyhledávaní je přístupné zde: https://catalog.loc.gov/vwebv/searchAdvanced. Popis logických spojek je následující:
AND: Výsledek obsahuje oba zadané výrazy
OR: Výsledek obsahuje alespoň jeden zadaný výraz
NOT: Výsledek neobsahuje zadaný výraz
Vyhledávání probíhá pomocí podobných kategorií. Jejich počet je ovšem větší. Také zde funguje filtrování výsledků a zástupné symboly. Podobu pokročilého vyhledávání lze vidět na obrázku č. 6.
Obrázek 6: Pokročilé vyhledávání (Library of Congress, 2021g)
Lze vyhledávat dle názvu, autora, oblasti, popř. si vybrat jakékoliv z definovaných kategorií (pod položkou EXPERT) na tomto seznamu: https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_name.html. U této kategorie lze také používat logické spojky. U všech kategorií funguje filtrování výsledků.
Ukázka vyhledávání v uložišti
Pro zkoušku vyhledáme publikace, která má v názvu Abraham Lincoln. Vyhledáváme tedy dle kategorie TITLE. První publikace se věnuje armádní kariéře Abrahama Lincolna. Je tedy relevantní k danému hledanému výrazu. To lze vidět na obrázku č. 7.
Obrázek 7: Ukázka vyhledávání (Library of Congress, 2021h)
Po otevření se nám zobrazí informace o publikace. Je zde uveden autor publikace (včetně roků, kdy žil), název publikace, typ publikace, nakladatel a rok vydání. Dále je zde možnost o tuto knihu zažádat (ve fyzické podobě) a zjistit, kde se kniha nachází. To lze vidět na obrázku č. 8.
Obrázek 8: Náhled informací o knize (Library of Congress, 2021i)
Mimo tyto informace jsou zde popsány informace o knize (počet stran, rozměry, materiál), ID v rámci knihovny, sekce, kde se publikace nachází a v jakých kategoriích je kniha řazena. Pro knihy, zde moc dodatečných informací není. Pro filmové publikace je jich ovšem více. Jsou zde např. uvedeni herci a všechny osoby spolupracující na filmu. Dále jsou zde i poznámky k obsahu filmu, co vše mimo film obsahuje (např. reklamy apod).
Autory publikací, popř. herce lze vyhledávat pomocí hyperlinkových odkazů, které přesměrují uživatele do vyhledávání dle dané kategorie. To lze např. vidět níže na obrázku č. 9.
Obrázek 9: Vyhledávání autora pomocí hyperlinkového odkazu (Library of Congress, 2021j)
Vyhledávání v kolekcích dokumentů
Knihovna umožňuje také vyhledávat v kolekcích dokumentů (např. soukromou korespondenci osob apod), popř. hledat jiné poskytovatele, kteří mají dokumenty, které se věnují dané oblasti, popř. obsahuje e-dokumenty (knihy, deníky). Ty jsou dostupné přes katalog knihovny na obrázku č. 10 (modře interní kolekce, zeleně externí kolekce a e-dokumenty).
Obrázek 10: Vyhledávání v kolekcích dokumentů (Library of Congress, 2021e)
V interních dokumentech se dá vyhledávat dle zadaného výrazu, popř. zobrazit všechny kolekce dle dané kategorie. Vyhledávání lze vidět na obrázku č. 11.
Obrázek 11: Vyhledávání v interních kolekcích (Library of Congress, 2021k)
Při rozkliknutí výsledků se zobrazí informace o kolekci, kde se fyzicky nachází a co je jejím obsahem. Každý dokument je zde také popsaný.
Vyhledávání na externí kolekce probíhá výběrem oblasti, popř. zadáním do vyhledávání. Externí vyhledávání lze vidět na obrázku č. 12.
Obrázek 12: Vyhledávání v externích kolekcích (Library of Congress, 2021l)
Zde se po rozkliknutí zobrazí seznam externích poskytovatelů dat, které mají o dané oblasti potřebné data. U každého je také popis, který vysvětluje, jaké informace se zde nacházejí a zda je přístupný zdarma, popř. za poplatek. To lze vidět na obrázku č. 13.
Obrázek 13: Detail externí kolekce (Library of Congress, 2021l)
Po přepnutí na e-dokumenty se po rozkliknutí zobrazí informace o daném dokumentu, včetně informací, zda je přístupný a odkaz na externí stránky, kde je umístěn
Závěr
Informační zdroj loc.gov je přístupovým prostředí do sbírek Knihovny Kongresu. Z tohoto zdroje lze tak přistupovat k největším světovým sbírkám publikací o velikosti přesahující 170 mil. kusů. Umožňuje vyhledávat jak fyzické kusy, které si lze v knihovně zapůjčit, tak i v digitalizovaném archivu, včetně multimediálních záznamů. Mimo vlastní sbírky knihovny kongresu umožňuje vyhledávat také v dalších informačních zdrojích mimo vlastní sbírky knihovny.
V práci je popsán způsob práce s tímto informačním zdrojem z hlediska vyhledávání.
LIBRARY OF CONGRESS, 2021a. General Information. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/about/general-information/
LIBRARY OF CONGRESS, 2021c. LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/
LIBRARY OF CONGRESS, 2021d. Search in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/search/?in=&q=&new=true&st=
LIBRARY OF CONGRESS, 2021e. Search option in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/
LIBRARY OF CONGRESS, 2021f. Browse in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchBrowse
LIBRARY OF CONGRESS, 2021g. Advance search in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchAdvanced
LIBRARY OF CONGRESS, 2021k. Search Finding Aids. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://findingaids.loc.gov/
LIBRARY OF CONGRESS, 2021l. Library of Congress E-Resources Online Catalog. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://eresources.loc.gov/
Doing Business je projekt založen roku 2002, který zkoumáním několika metrik porovnává prostředí podnikové regulace v téměř 190 ekonomikách s cílem poskytnout akademickým pracovníkům, novinářům, zájemcům v oblasti ekonomiky a dalším informace o tom, který stát přináší nejpřijatelnější prostředí pro podnikání. Doing Business se nezaměřuje pouze na zkoumání podnikové regulace na úrovni států, ale provádí také studie různých měst a regionů ve vybraných zemích. Uživatel může porovnávat nejen státy světa, ale také některá jejich města. Lze tedy získat povědomí o tom, které město je z hlediska snadnosti podnikání optimální. Dalším záměrem tohoto projektu je vzbudit soutěživost jednotlivých ekonomik o vytvoření co nejadekvátnějších regulací. [1]
Indikátory
První zveřejněná studie Doing Business byla již rok po jeho založení, tedy v roce 2003. Studie zkoumala snadnost podnikání u 133 ekonomik pomocí 5 identifikátorů. Od této doby došlo k značnému pokroku, kdy letošní studie zahrnuje 190 ekonomik, které jsou měřeny pomocí 11 indikátorů. [1]
Seznam těchto indikátorů, včetně popisu, co je u nich měřeno obsahuje tabulka č.1., která je volně dostupná na stránkách Doing Business v sekci About.
Tabulka 1 Indikátory a co je u nich měřeno [2]
Indikátory
Co je měřeno
Starting a business
Postupy, čas, náklady, minimální kapitál pro založení s.r.o. pro muže a ženy
Dealing with construction permits
Postupy, čas a náklady na vyřízení všech formalit k vybudování skladu, mechanismy kontroly kvality a bezpečnosti v systému stavebního povolení
Getting electricity
Postupy, čas, náklady na připojení k elektrické síti, spolehlivost dodávky a transparentnost tarifů dodavatelů elektřiny
Registering property
Postupy, čas, náklady na převod nemovitostí. Kvalita systému katastrálního úřadu pro muže a ženy
Getting credit
Zákony o movitých věcech a úvěrové informační systémy
Protecting minority investors
Práva menšinových akcionářů v transakcích se spřízněnými stranami a ve správě a řízení společností
Paying taxes
Platby, čas a celková daň a sazba příspěvku, aby firma splňovala všechny daňové předpisy i procesy následné archivace
Trading across borders
Čas a náklady na export produktů s komparativní výhodou a na import zboží
Enforcing contracts
Čas a náklady na vyřešení obchodního sporu a kvalita soudních procesů pro muže a ženy
Resolving insolvency
Čas, náklady, výsledek a míra vymáhání obchodní neschopnosti a síla právního rámce pro platební neschopnost
Employing workers*
Flexibilita regulace zaměstnanosti
Contracting with the government*
Postupy, čas na účasti a získání veřejných zakázek. Regulační rámec spojený se zadáváním veřejných zakázek
* Nejsou součástí hodnocení v Doing Business 2020.
Získávání dat
Data, která společnost Doing Business využívá pro tvorby studií, jsou získávána ze 4 základních pramenů. Patří zde zákony a předpisy jednotlivých států, respondenti společnosti, vláda a zaměstnanci World Bank Group. Společnost uvádí, že má více než 48 tisíc profesionálů ve 190 ekonomikách. Kolekce dat následně probíhá pomocí písemné či ústní komunikace, dotazníkového šetření, vlastní návštěvou apod. [3] Celý proces, včetně časového harmonogramu se nachází na obrázku č.1.
Obrázek 1 Jak Doing Business sbírá a ověřuje data [4]
Využití
Doing Business představuje veřejně dostupný nástroj, jenž najde uplatnění v širokém spektru oblastí. Od roku 2003 bylo výzkumnými pracovníky napsáno tisíce článku opírající se o data, které poskytl tento nástroj. Dále kromě novinářů, lidí zajímající se o ekonomiku a mnoho dalších, je možno najít uplatnění i v oblasti zákonodárné, kdy poslanci/vláda mohou využít data pro objevení nedostatků země ve které působí a navrhovat efektivní zákony v oblasti podnikové regulace, které mohou vytvořit pro občany optimální prostředí pro podnikání a posunout ekonomiku země dopředu. [3]
První pohled na webové prostředí
Web společnosti Doing Business poskytuje uživatelům 7 jazykových mutací jako je angličtina, španělština, francouzština, portugalština, ruština, čínština a arabština. Při prvním pohledu na web uživatel hned vidí datový vyhledávač a přehled hlavních zjištění, kterých dosáhla společnost při tvorbě reportu „Doing Business 2020“. Za zmínku stojí například informace, že Saúdská Arábie, Jordánsko, Togo, Bahrajn, Tádžikistán, Pákistán, Kuvajt, Čína, Indie a Nigérie vykazují markantní zlepšení oproti minulých let. [5] Co se týče datového vyhledávače, jehož vzhled demonstruje obrázek č.2, ten nabízí uživateli možnost filtrace pomocí ekonomiky nebo indikátorů.
Obrázek 2 Datový vyhledávač na domovské obrazovce[5]
V případe filtrování podle ekonomiky (v tomto případě byla zvolena Česká republika) je uživatel přesměrován na záložku „Data“, kde mu jsou zobrazeny výsledky studie pro danou zemi. Uživatel se dozví, jaké celkové skóre země obdržela a na jaké pozici v celkovém žebříčku všech ekonomik se nachází.
Obrázek 3 Hodnocení České republiky [6]
Níže na stránce se nachází přehled, jak dopadlo hodnocení pro jednotlivé oblasti v rámci zvolené země. V případě České republiky může uživatel vidět, že ze všech zkoumaných ekonomik nabízí ČR nejlepší podmínky pro „Trading across Borders“. Na druhou stranu byla země nejhůř hodnocena v oblasti „Starting a Business“.
Obrázek 4 Výsledky pro jednotlivé oblasti [6]
Závěr přehledu tvoří interaktivní tabulka, kde se uživatel kliknutím na jednu z oblastní dozví, co vše bylo v rámci dané oblasti zkoumáno, včetně výsledků zkoumání. Vzhled tabulky pro oblast „Trading Across Boarders“ demonstuje obrázek níže.
Obrázek 5 Vzhled interaktivní tabulky [6]
V případě že by se uživateli o dané zemi chtěl dozvědět více než je zobrazeno na této stránce, je mu umožněno stáhnout si report v podobě PDF souboru, který obsahuje kompletní výsledky studie pro danou zemi včetně detailnějšího popisu jednotlivých oblastí. Pro zajímavost je vhodné zmínit, že v případě České republiky(odkaz) má report pro rok 2020 rozsah 69 stránek. Jestliže se nechce uživatel omezovat pouze na jeden stát a zajímají ho kompletní reporty studie „Doing Business“ zahrnující všech 190 ekonomik, stačí pouze v navigační části webu přejí na stránku „Reports“, kde jsou pro uživatele připravené PDF reporty již od vydaní pro rok 2004. Volba reportu probíhá pomocí rozbalovacího seznamu.
Obrázek 6 Rozbalovací seznam [7]
Rankings
Další možnosti stránky doingbusiness.org přináší záložka „Rankings“, kde se nachází tabulka obsahující všech 190 ekonomik a jejich hodnocení. Uživatel si zde může vybrat zda chce vidět hodnocení v podobě rankingu nebo skóre. Obě dvě hodnoty reflektují úspěšnost ekonomiky v oblasti snadnosti podnikání, akorát na jinačí škále. V případě rankingu nabývá hodnocení hodnot od 1 do 190, kdy stát držící ranking 1 představuje ekonomiku poskytující nejpříznivější podmínky z hlediska regulací pro podnikání. Jedná se tedy o určitý žebříček. Jak již je ukázáno na obrázku č.3, celkové umístění ČR je na 41. místě, což muže být poněkud uspokojující. Pro zájemce zde Doing Business zanechává link na PDF soubor s názvem „ease of doing business rankings and the ease of doing business scores are calculated“, kde je možné na 10 stránkách se dočíst jak ranking a skóre fungují a jak jsou vypočítávány. [8]
Pro možnost filtrování dat v tabulce na stránce jsou zde připraveny dva rozbalovací seznamy. První rozbalovací seznam pojednává o regionech a druhý o platových třídách (viz. obrázky níže).
Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]
Výslednou tabulku lze také stáhnout ve formátu .xlsx či PDF. V případě nevyužití rozbalovacího seznamu se na stránce nachází tabulka obsahujících všech 190 záznamů. Například z přiloženého obrázku č.8 lze vyčíst, že nejpřijatelnější prostředí pro podníkání z pohledu státní regulací je Nový Zéland.
Obrázek 8 Nejlépe hodnocené ekonomiky [8]
Historical Data Sets and Trends Data
Záložka „Historical Data Sets and Trends Data“ umožňuje uživateli vygenerovat si dataset na základě jeho preferencí z dat, které Doing Business má. Tvorba zde probíhá ve 3 krocích, kdy v prvním si uživatel vybere ekonomiky, které chce v datasetu mít. Uživatel si může vyklikat jednotlivé ekonomiky nebo využít předdefinovaných skupin tvořených buď podle regionů, nebo platových skupin.
Obrázek 9 Vzhled filtru pro vytváření datasetu [9]
V kroku č.2 dochází k volbě oblastí – Starting a Business, Getting Credit, Trading across Borders apod. Poslední krok nabízí možnost zvolit si zda bude dataset obsahovat data pouze z Doing Business 2020, či i starší. Výsledek se na stránce zobrazí ve formě interaktivní tabulky s možnosti stažení ve formátu .xlsx či pdf.
Law Library
Záložka s názvem „Law Library“ se představuje jako největší online sbírka obchodních zákonů a předpisů. [10] Jedná se o velice povedený nástroj, kdy pomocí filtrů je uživatel schopen si vyhledat zákony a předpisy ve 190 ekonomikách. Na výběr je zde od administrativních až po daňové zákony. Výsledek se zobrazí ve formě url linku odkazujících na relevantní zdroj. V případě bankovního práva České republiky se jedná o webové stránky ČNB.
Obrázek 10 Bankovní a daňové zákony pro ČR [10]
Business Reforms
Poslední zajímavý nastroj přináší záložka s názvem „Business Reforms“, kde pomocí selekce ekonomiky, oblasti či regionu se uživatel může dozvědět, jaké se v dané lokalitě vytvořily reformy pro ulehčení či ztížení podnikaní. V případě, pro tuto práci zvolené, České republiky se zde vyskytuje poslední záznam z roku 2018, kde ČR provedla zlepšení v oblasti „Starting Business“ a to snížením poplatků pro založení společnosti s ručeným omezeným. Naopak ke ztížení podnikaní došlo v oblasti placení daní, kde zavedením nových požadavků na vyplnění přiznání k DPH došlo ke zkomplikování procesu placení daní. [11]
Obrázek 11 Business reformy pro ČR [11]
Závěr
Doing Businnes představuje projekt založený v roce 2002, který provádí studie v celkem 190 ekonomikách napříč světem. Cílem projektu je zmapovat oblast podnikové regulace v jednotlivých ekonomikách a určit, který stát přináší nejpřijatelnější prostředí pro podnikání. Výsledky jejich studie následně publikují na svých stránkách s názvem “Doing Business”, kde jsou volně ke stažení v PDF formátu. Mimo toho se na stránkách společnosti nachází cela řada užitečných nástrojů. Za zmínku stojí třeba možnost stažení si datasetu Doing Business, nahlédnout do největší online sbírky obchodních zákonů a mnoho dalších. Autor doporučuje všem čtenářům si webovou stránku společnosti Doing Business prohlédnout, jelikož se jedná o velice zajímavý a přínosný projekt nacházející uplatnění v mnoha oblastech od novinařiny až po politiku.
Zdroje
[1] About us. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/about-us
[8] Rankings. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/rankings
[9] Historical Data Sets and Trends Data. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/custom-query
[10] Law Library. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/law-library
Zkratka CC reprezentuje název neziskové organizace Creative Commons, která se zabývá licencováním multimediálního obsahu. Zároveň do jejího portfolia spadá již zmíněný CC Search, což je nástroj, který umožňuje snadno objevovat a používat otevřeně licencovaná a veřejně dostupná autorská díla pomocí snadného vyhledávání. CC Search prohledává více než 300 milionů obrázků z otevřených API a datové sady Common Crawl. Jde nad rámec jednoduchého vyhledávání a agreguje výsledky napříč několika veřejnými úložišti (Flickr, Europeana,… ) do jednoho souhrnného katalogu. V současné době CC Search plně podporuje prohledávání obrázků, ale plánují plně implementovat vyhledávání napříč dalšími typy médií, jako jsou otevřené texty, audio a video. Tento „další“ multimediální obsah momentálně běží v testovací verzi. Obsah z těchto platforem lze prohledávat pomocí CC Search a sdílet na webu díky licencím CC.
Obrázek: Ukázka log procházených informačních zdrojů s licencovaným obsahem dle CC. [Zdroj: creativecommons.org]
Typy licencí Creative Commons
Každé dílo, ať už jde o obrázek, fotografii, hudbu, odborný i prozaický, nebo i poetický text, má svého autora a ten vlastní k dílu autorská práva. Ta obsahují mix práv a povinností spjatých s daným dílem a stanovují to, jak se s ním smí zacházet. Autorskoprávní nástroje a licence Creative Commons vytvářejí rovnováhu v rámci tradičního nastavení „všechna práva vyhrazena“, které jinak automaticky autorské právo zajišťuje. Nástroje Creative Commons nabízejí každému, od jednotlivých autorů až po velké společnosti jednoduchý standardizovaný způsob, jak umožnit ostatním užívat jejich dílo. Přehled jednotlivých licencí s ukázkou práv a povinností k nim spjatých je uveden v následující tabulce.
Tabulka: Znázorňující přehled CC licencí a jejich práv + povinností [Zdroj: web.natur.cuni.cz]
Možnosti vyhledávání v CC Search
Na první pohled při příchodu na platformu CC Search, která se nachází na adrese https://search.creativecommons.org se uživateli objeví nápadně podobné rozhraní připomínající jinou vyhledávací platformu Google. Uprostřed obrazovky se tyčí velký Search Bar umožňující zadání klíčových slov pro vyhledávání v rámci obsahu, který je licencovaný pomocí CC licencí. Po kliknutí na tlačítko Search se uživateli zobrazí, stejně jako u Googlu katalog výsledků, které se vztahují ke klíčovým slovům, jenž uživatel zadal k vyhledání.
Obrázek: Úvodní stránka při příchodu na search.creativecommons.org [Zdroj: Vlastní zpracování]
Syntaxe vyhledávání
Stejně jako již zmíněný Google, tak i CC Search umožňuje uživatelům konkretizovat jejich vyhledávání pomocí speciálních symbolů nebo slov, které slouží k bližšímu upřesnění vámi hledaných spojení.
Vyhledávání s přesnou shodou
Pro vyhledávání slova nebo fráze je nutné hledaný termín dát do uvozovek. Například pro doslovné vyhledávání tvrzení Empire State building je potřeba do Search Baru zadat „Empire State Building“, tím dáváme najevo, že nás zajímá jen přesná shoda, nikoliv částečná.
Kombinování vyhledávaných termínů
Pokud by uživatel potřeboval různě kombinovat vyhledávané termíny, tak k tomu slouží operátory, které umožňují vykonávat komplexnější dotazy. Nejprve budou představeny samotné operátory a poté ke každému bude uveden příklad využití a vysvětlení jak funguje.
+ Operátor značící logickou operaci AND
| Operátor značící logickou operaci OR
– Operátor negující jeden token/termín
* Operátor, který na konci hledaného výrazu značí tzv. prefix query
() Operátor pro signalizaci priority
~N Operátor uvádějící se na konci slova sloužící k nastavení Fuzzy distance výrazu
Příklady vyhledávání:
dog+cat -> Tento dotaz vyhledá výsledky, na kterých je jak pes, tak kočka.
dog|cat -> Tento dotaz by vyhledal výsledky, na kterých je buď pec nebo kočka, ale nemusely by tam nutně být oba.
dog -buldog -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale vynechal by ty na nich je vyobrazený buldok. Využili jsme daný operátor – k vyloučení buldočího plemene z výsledků vyhledávání psů.
net* -> Tento dotaz by vyhledal výsledky pro slova, které začínají na net a hvězdička poté značí, že může následovat cokoliv. Jedná se o takzvaný Wildcard operátor. Takže ve výsledcích by se mohla objevit slova jako: Netflix, Netherlends, network, a spousta dalších.
dogs + (labrador|chivava) -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale konkrétně čivava nebo labrador. Závorky slouží k určení priority dotazu nebo ke kombinování složitějších dotazů.
theatre~1 -> Tento dotaz by vyhledal výsledky, které se mohou lišit o proti hledanému výrazu o jeden znak. Výsledek by tedy mohl obsahovat slova, která mají jiný pravopis jako třeba Theater místo Theatre. Tento jev se odborně nazývá fuzzy logic/fuzziness.
Vyhledávání přesného výrazu
Vyhledávání psa a kočky
Vyhledávání psa nebo kočky
Vyhledávání psů bez buldogů
Vyhledávání s prefixem
Ukázka využití priority pomocí závorek
Galerie obrázků: Ukázky příkladů vyhledávání [Zdroj: Vlastní zpracování]
Meta Search
Meta vyhledávač (známý také jako více vláknový modul) je vyhledávací nástroj, který odesílá váš dotaz současně několika vyhledávačům (Search Engine), webovým adresářům (WD) a někdy i takzvanému Invisible (Deep) Webu, shromažďování online informací neindexovaných tradičními vyhledávači. V tomto případě se vyhledávač snaží najít veškery obsah indexovaný licencemi Creative Commons. CC Search následně z posbíraných pozitivních výsledků hledání vytvoří katalog, který se uživateli zobrazí jako výsledek hledání, ale tato funkcionalita zatím funguje pouze pro obrázky. Audio a Video má na stránce zastoupení v záložkách, ale hledání momentálně nabízí jen odkazy na zdroje obsahující daný obsah pod licencemi CC, což je názorně předvedeno v přiložených obrázcích.
Výsledek vyhledávání obrázku pro slovo Drum
Výsledek vyhledávání audia pro slovo Drum
Výsledek vyhledávání videa pro slovo Drum
Galerie obrázků, které ukazují výsledky vyhledávání [Zdroj: Vlastní zpracování]
Filtrování a přehled výsledků
Výsledný agregovaný katalog obrázků pro audio a video tato funkcionalita zatím nefugnuje, lze dále selektovat finální výběr obrázků, na základě intuitivních filtrů, které CC Search nabízí v levém menu. K dispozici jsou uživateli filtry podle:
Použití obrázku
Typu CC licence obrázku
Zdroje obrázku
Typu obrázku
Formátu obrázku
Poměru stran
Velikosti obrázku
Autora
Filtry fungují velmi intuitivně jako na většině eshopů a běžných stránkách, kdy uživatel vybere jednotlivé filtry, o které má zájem a ty mu automaticky překreslují výsledný katalog, aby splňoval uživatelem stanovené požadavky. Pokud by si přál odstranit nějaký konkrétní filtr, tak jej stačí odkliknout nebo zrušit křížkem, případně je zde možnost vyčistit všechny filtry, která zruší veškeré nastavené filtrování výsledků.
Ukázka 1 možností filtrování výsledného katalogu
Ukázka 2 možností filtrování výsledného katalogu
Galerie obrázků, které ukazují možnosti filtrování v rámci výsledného katalogu obrázků
Abychom poskytli co nejlepší služby, používáme k ukládání a/nebo přístupu k informacím o zařízení, technologie jako jsou soubory cookies. Souhlas s těmito technologiemi nám umožní zpracovávat údaje, jako je chování při procházení nebo jedinečná ID na tomto webu. Nesouhlas nebo odvolání souhlasu může nepříznivě ovlivnit určité vlastnosti a funkce.
Funkční
Vždy aktivní
Technické uložení nebo přístup je nezbytně nutný pro legitimní účel umožnění použití konkrétní služby, kterou si odběratel nebo uživatel výslovně vyžádal, nebo pouze za účelem provedení přenosu sdělení prostřednictvím sítě elektronických komunikací.
Předvolby
Technické uložení nebo přístup je nezbytný pro legitimní účel ukládání preferencí, které nejsou požadovány odběratelem nebo uživatelem.
Statistické
Technické uložení nebo přístup, který se používá výhradně pro statistické účely.Technické uložení nebo přístup, který se používá výhradně pro anonymní statistické účely. Bez předvolání, dobrovolného plnění ze strany vašeho Poskytovatele internetových služeb nebo dalších záznamů od třetí strany nelze informace, uložené nebo získané pouze pro tento účel, obvykle použít k vaší identifikaci.
Marketingové
Technické uložení nebo přístup je nutný k vytvoření uživatelských profilů za účelem zasílání reklamy nebo sledování uživatele na webových stránkách nebo několika webových stránkách pro podobné marketingové účely.