SocialBearing: Rozšířený vyhledávač dění na Twitteru

Autor:

novka

-

9.12.2021

0

Úvod

SocialBearing je vyhledávač pro sociální síť Twitter. Je zdarma a online k dispozici na webu. Většinu funkcí má k dispozici bez přihlášení, pro některé funkce je ale nutné se přihlásit přes twitterovský účet. V souhrnu vyhledává, filtruje a řadí tweety nebo lidi podle angažovanosti, vlivu, místa sentimentu a dalších vlastností.

Vyhledávací možnosti

Na hlavní stránce vyhledávače je možné zvolit, co chceme vyhledávat:

Přátele jakéhokoliv veřejného účtu.
Sledující jakéhokoliv veřejného účtu.
Lidé, kteří odpovídají vyhledávaným slovům.
Pozice tweetu na mapě podle hashtagu (volitelné) a místa (nutné zadat radius).
Analýza časové osy pro jakýkoliv veřejný účet.
Tweety, které obsahují klíčová slova nebo hashtagy.
- Zde je možné rozšířené vyhledávání.

Jednotlivé položky budou představeny v následujících sekcích.

SocialBearing: Rozšířený vyhledávač dění na Twitteru — Obrázek 1: Vyhledávací menu webu SocialBearing.com.

Vyhledávání přátel a sledujících

Po vyhledání uživatelského jména se zobrazí přehled 100 přátel/sledujících, pokud si chci zobrazit přehled dalších 100, tak si je musím načíst. Zobrazení je pro tyto dva typy vyhledávání stejný, dává nám k dispozici informace o:

celkových číslech uživatelů,
koláčové grafy jazyků uživatelů a zařízení které používají,
grafy aktivit v průběhu dne, počtu tweetů, rozložení počtu sledujících a sledovaných,
cloud hashtagů a použitých slov,
mapa zemí, ke které se uživatelé hlásí,
výčet uživatelů.

V levém panelu jsou k dispozici základní informace o uživateli a rozsáhlé možnosti filtrování, díky kterému se může zúžit výčet informací o uživatelích, kteří nás zajímají.

Jednou ze zajímavých informací o profilu je „TUQI Score“. Je to hodnota, kterou vypočítává SocialBearing z mnoha metrik (např. počet sledujících, srovnání tweetů/sledujících, datum posledního tweetu a další). TUQI Score je pokus, jak značit kvalitu účtu, kde vyšší hodnota značí zajímavý, aktivní účet, zatímco účet s nízkým TUQI Score pravděpodobně značí spam uživatele nebo uživatele, který není tolik aktivní.

Lidé, kteří odpovídají vyhledávání

Zde se dají vyhledávat lidé, kde vyhledávaný výraz jde najít ve jménu, biu, zájmech, poloze, nebo jiných kritériích. Na začátku se zobrazuje 20 uživatelů, ale přes tlačítko „show more“ se mohou ukázat další uživatelé.

Po vyhledání jsou k dispozici následující informace:

celková čísla výsledků,
koláčové grafy jazyků uživatelů a zařízení které používají,
grafy aktivit v průběhu dne, počtu tweetů, rozložení počtu sledujících a sledovaných,
cloud hashtagů a slov objevujících se v biu uživatelů,
mapa zemí ke které se uživatelé hlásí,
výčet uživatelů.

V levém panelu je k dispozici přehled uživatelů s největším počtem sledujících, s největším počtem tweetů a dále další možnosti filtrování.

Geolokace tweetů

V tomto vyhledávači se zobrazují tweety dle polohy a případně upřesněná o klíčová slova / hashtagy. Lokace se omezuje okruhem kilometrů, který se dá nastavit v rozsahu 2-2000 km. Hlavním výsledkem tohoto vyhledávání je mapa, kde jsou na mapě zobrazeny místa, kde byly napsány tweety, které byly vyhledány.

Po vyhledávání jsou k dispozici následující informace:

mapa tweetů,
celková čísla výsledů,
grafy tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatelů, jazyka, sdílené domény),
cloud hashtagů a slov objevujících se v tweetech,
seznam tweetů.

V levém panelu jsou k dispozici rozsáhlé možnosti filtrování.

Časová osa uživatele

Předposledním vyhledáváním, které zde bude představeno, je časová osa vyhledávaného uživatele pomocí uživatelského jména. Zobrazuje v levém panelu základní informace o uživateli a možnosti filtrování tweetů. Hlavním výsledkem vyhledávání jsou statistiky tweetů uživatele a jejich analýza. Základně se zobrazuje 200 nejnovějších tweetů, ale stejně jako v předchozích sekcích, i zde je možnost počet těchto tweetů rozšířit.

Po vyhledávání jsou k dispozici následující informace:

celková čísla uživatele,
grafy tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatele, jazyk tweetů, sdílené domény),
cloud hashtagů a slov objevujících se v tweetech,
seznam tweetů.

Vyhledávání tweetů

Poslední sekcí je vyhledávání tweetů pomocí klíčových slov a hashtagů. Zde je k dispozici i rozšířené vyhledávání ve kterém je možné se omezit pouze na fotky/odkazy/videa/verifikované, nebo aplikovat jiné rozšířené vyhledávání. Zároveň jde vyhledávání upřesnit na přesnou shodu.

Po vyhledávání jsou k dispozici následující informace:

celková čísla vyhledávání,
grafy vyhledaných tweetů (dle sentimetu, typu – tweet/retweet/comment, zařízení uživatele, jazyk tweetů, sdílené domény),
cloud hashtagů a slov objevujících se v tweetech,
seznam tweetů.

Speciální nástroje ve vyhledávání

Tweets by sentiment

Jedná se o analýzu, která je ukázána u tweetů v podobě grafu. Hodnotí jaký sentiment mají tweety a to podle slov, které vyhledávač najde v tweetech. Má naučenou databázi slov, která dokáže přiřadit k jednotlivým sentimentům. Je to dobře viditelné na obrázku 7, kde jsou citově zabarvená slova zvýrazněna(červeně – záporný tweet, zeleně – kladný tweet). Bohužel vyhledávač neumí rozpoznat ironii, takže je nutné brát hodnocení s odstupem.

Hashtag/word cloud

Dalším zajímavým výsledkem vyhledávání, který stojí za zmínku je mapa hashtagů a slov, které jsou v nalezených tweetech. Na obrázku 8 je vidět, že twitterem hýbe dnešní krize na ukrajině a je s ním ve velkém spojováno slovo Rusko, Ukrajina a válka.

Export do csv

Některé vyhledané informace jde uložit do souboru formátu csv. Díky tomu můžeme vyhledávač použít pro najití dat, se kterými budeme dále pracovat a vytvářet si vlastní analýzu, nebo jiné zpracování dat.

Závěr

SocialBearing.com je zajímavý vyhledávač, pokud chceme zjistit širší pohled na Twitter tématiku, kouknout se na statistiky tweetů, nebo uživatelů. Nebo pokud si jen chceme analyzovat vlastní profil. Výhoda vyhledávače je, že je zdarma. Nevýhodu, kterou jsem objevil je, že nové tweety zakrývají starší do pozadí a vyhledávání geolokace tweetů probíhá velmi pomalu a často se výsledek nezobrazí.

Zdroje

Twitter analytics for Tweets, timelines & twitter maps: Social Bearing. Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing. (n.d.). Retrieved December 8, 2021, from https://socialbearing.com/.

Seznam obrázků

Obrázek 1: Vyhledávací menu webu Socialbearing.com. [Zdroj: https://socialbearing.com/]

Obrázek 2: Náhled na statistiky sledujících. [Zdroj: https://socialbearing.com/]

Obrázek 3: Výsledek hashtag mapy při vyhledávání slova “Slavia”. [Zdroj: https://socialbearing.com/]

Obrázek 4: Výsledek vyhledávání tweetů v Praze (radius 2 km). [Zdroj: https://socialbearing.com/]

Obrázek 5: Výsledná analýza časové osy uživatele @JaroslavTvrdik. [Zdroj: https://socialbearing.com/]

Obrázek 6: Výsledky hledání tweetů s obsahem “Carlsen Nepomniachtchi” ve světě. [Zdroj: https://socialbearing.com/]

Obrázek 7: Vyhledané citově zabarvené tweety výsledku “Carlsen Nepomniachtchi”. [Zdroj: https://socialbearing.com/]

Obrázek 8: Hashtag cloud a word cloud výsledku vyhledávání “Russia”. [Zdroj: https://socialbearing.com/]

Census.gov: co prozrazují o Američanech data

Autor:

Karel Balogh

-

16.9.2021

0

Úvod

Sčítání lidu v USA je řízeno pod záštitou organizace United States Census Bureau (UCSB), v češtině tzv. Americký úřad pro sčítání lidu. Ten poskytuje údaje o lidech a ekonomice národa. Každých 10 let provádí sčítání lidu, domů a bytů, do kterého se počítají všichni obyvatelé Spojených států. Agentura také shromažďuje údaje prostřednictvím více než 100 dalších průzkumů u domácností a podniků každých jeden až pět let.

Četné sčítání a průzkumy každý rok pomáhají jednotlivým státům, místním komunitám a podnikům rozdělit více než 675 miliard dolarů ve federálních fondech a zároveň pomáhají státům, místním komunitám a podnikům při přijímání informovaných rozhodnutí. Podniky používají údaje ze sčítání k určení, kde by měly být postaveny sklady, kanceláře a obchody, což vede k vytváření pracovních míst. Developeři k výstavbě nových domů a revitalizaci stávajících. Sčítání používají místní samosprávy k veřejné bezpečnosti a připravenosti na mimořádné události. Obyvatelé používají sčítání k prosazování politiky, kvality života a programů prosazování práv spotřebitelů ve svých komunitách.

První sčítání proběhlo více než rok po inauguraci prezidenta George Washingtona a těsně před skončením druhého zasedání prvního kongresu. Za sčítání lidu z roku 1790 dostali od kongresu odpovědnost jednotliví maršálové. Pohlaví, barva, vztah k osobě v čele domácnosti, jméno osoby v čele domácnosti a případně počet otroků, to vše bylo součástí šesti šetření v roce 1790. Maršálové některých států šli nad rámec těchto dotazů a shromažďovali informace o zaměstnání a počtu bytů ve městě.

Typologie datasetů

Řada základních statistik podnikání (Core Business Statistics)

V pěti tabulkách dat, které jsou zveřejněny na data.census.gov počínaje zářím 2019, nabízí řada Core Business Statistics řadu statistik o počtu provozoven, pracovních míst, mezd a hodnotě tržeb, příjmů, příjmů nebo zásilek pro provozovny společností s platícími pracovníky pro jednotlivá odvětví na úrovni USA nebo státu.

Statistiky dle geografie (Geographic Area Series)

Série geografických oblastí obsahuje komplexní odvětvové statistiky pro podniky s platícími pracovníky podle zeměpisných oblastí. Informace jsou založeny na severoamerickém průmyslovém klasifikačním systému (NAICS) pro rok 2017.

Shrnující statistiky (Subject & Summary Series)

Tyto statistiky obsahují souhrnná data dle odvětví a dalších specifických témat. Tyto údaje víceméně shrnují informace, které jsou zveřejněny v datových řadách pro podnikání či pro jednotlivá geografické oblasti. Obsah těchto sérií je nadále seskupen dle tematických sestav, které např. zahrnují: produktové řady, provozny a jejich velikosti, lokaci výrobních závodů apod. Data pro tato témata jsou primárně k dispozici na úrovni USA a u vybraných témat na úrovni státu.

Kategorizace dat

Velký objem dat, které UCSB sdružuje, jsou děleny dle NAICS struktury a kódů.

NAICS struktura

NAICS struktura je dělena do hierarchického vztahu:

Sektor: dvoučíselný kód
- Subsektor: tříčíselný kód
  - Skupina odvětví: čtyřčíselný kód
    - NAICS odvětví: pětičíselný kód
      - Státní odvětví: šestičíselný kód

Census.gov: co prozrazují o Američanech data — Obrázek 1: NAICS hierarchie; zdroj: census.gov

Definice sektorů

V NAICS struktuře je zahrnuto 20 sektorů. Až na sektory 11 a 92 (viz níže) jsou zahrnuty do ekonomického sčítání.

Vládní instituce nejsou do ekonomického sčítání obvykle zahrnuty, i když bude jejich primární provoz klasifikován v průmyslových odvětvích zahrnutých do ekonomického sčítání. Údaje o sčítání lidu z průmyslových odvětví v několika odvětvích se mohou v důsledku těchto výluk zdát neúplné. Zároveň byly z hospodářského sčítání vyloučeny některé oficiální operace:

Nemocnice
Vládní obchody s lihovinami
Vydavatelé univerzitního tisku
Federální rezervní banky

Existuje samostatné sčítání vlád, které poskytuje některé údaje o příjmech, výdajích a zaměstnanosti pro různé vládní funkce, jako jsou ulice a dálnice, nakládání s pevným odpadem, kanalizace, elektrická energie, doprava a místní knihovny.

Hledání dat na census.gov

Hledání dat přes census.gov můžeme rozdělit do dvou perspektiv: uživatelské rozhraní a developerské rozhraní přes API. Z uživatelského pohledu je hledání dat velmi jednoduché. Census.gov nabízí dva primární nástroje: QuickFacts a Census Business Builder.

QuickFacts

QuickFacts je uživatelsky přívětivý rámec, který nabízí tabulky, mapy a grafy běžně požadovaných statistik z různých sčítání lidu, průzkumů a služeb. K dispozici jsou profily pro celou zemi, všech 50 států, District of Columbia a Portoriko, stejně jako všechny kraje. Zahrnuty jsou také města a města s počtem obyvatel 5 000 a více.

Uživatel si lehce může zvolit lokalitu a v nabídce rychle zvolit i jednotlivé fakta. Po zadání svého požadavku si uživatel může daná data zobrazit graficky na mapě či v jiném grafickém vyjádření. Zajímavostí pro uživatele může být i vytvoření dashboardu či možnosti sdílení dat přes email či sociální sítě (FB, Twitter). Uživatel si samozřejmě může data vytisknout či stáhnout ve formátu CSV.

Census Business Builder

Census Business Builder (CBB) je kolekce služeb Census Bureau, která poskytuje demografické a ekonomické údaje přizpůsobené konkrétním typům uživatelů ve snadno použitelném formátu. Co si pod tím ale představit? Tento nástroj je speciálně mířen na byznys uživatele, který mají za cíl založit podnik a chtějí získat počáteční data pro svoje rozhodování. CBB na základě lokace a odvětví či NAICS kódu uživateli přípraví report, který je dělen do několika částí:

Potenciální zákazníci
- demografická analýza
- socioekonomická analýza
- ostatní relevantní analýzy
Analýza daného sektoru v dané lokalitě
Analýza spotřebitelských výdajů
Ostatní (liší se dle uživatelských vstupů při hledání)

Níže jako příklad uvádím část reportu pro tyto zadané vstupy: odvětví – komerční nemovitosti, lokalita – Oklahoma City.

Census Data API

Census Data Application Programming Interface (API) je datová služba, která umožňuje vývojářům softwaru přistupovat a používat data Census Bureau v rámci svých aplikací. Toto API používají výzkumní pracovníci a vývojáři aplikací v rámci Census Bureau i mimo něj. Jeho jednoduchý nezpracovaný formát usnadňuje a zpřístupňuje zadávání dat v jakémkoli formátu, který uživatelé potřebují pro prezentaci a manipulaci s daty. Census Data API je rychlý a snadný způsob dotazování dat přímo ze serverů Census Bureau a přináší řadu výhod:

Snadné stahování cílových proměnných a geografických oblastí
Připojuje se ke statistickým nástrojům, jako jsou R a SAS
Poskytuje okamžitý přístup k nejnovějším datům
Usnadňuje vytváření inovativních mobilních a webových aplikací
Vytváří vizualizace dat

Census Bureau již zpřístupnilo většinu svých datasetů a přidává na měsíční bázi další. Mezi nejčastěji využívané patří:

American Community Surveys (ACS)
Časové řady ekonomických ukazatelů
Desetileté sčítání lidu
Ekonomické sčítání lidu
Odhady populace a projekce
Mezinárodní obchod

Kompletní list dostupných datasetů lze najít přes tzv. API Discovery Tool.

Queries fungují na stejné bázi jako jakékoliv jiné informační zdroje. Census Bureau používá nestandardní verzi JSON, kde data jsou reprezentovány v dvourozměrném poli, hranaté závorky (“[]”) obsahují pole a hodnoty jsou odděleny čárkou. Viz příklad níže:

Klíčové pojmy důležité pro práci s API Census Bureau

Proměnné
- Každá jednotka dat, kterou uživatel hledá v datové sadě, se označuje jako proměnná. Každá proměnná v datové sadě má název, který může být sám o sobě zkratkou nebo něčím smysluplným, například STNAME, POP nebo DATE_.
Povinné proměnné
- Povinné proměnné jsou parametry, které uživatel musí zahrnout do vyhledávání; v opačném případě jeho vyhledávání neprodukuje žádná data a vrátí chybovou zprávu.
Atributy
- Další proměnné, které může uživatel použít při volání API k poskytnutí dalších podrobností o primární proměnné, se nazývají atributy. Lze zahrnout například štítky, poznámky, meze chyby, statistickou významnost apod.
Get Funkce
- Funkce get (get =) určuje požadované a vybrané proměnné, které od API žádá uživatel.
Predikáty
- Uživatel může vytvořit predikáty pro geografii, string proměnné, číselné proměnné a čas; a všechny určují, jak by měly být proměnné filtrovány nebo omezovány (v souborech dat časové řady).
Group Funkce
- Funkce group umožní uživatelovi získat výsledky pro celou tabulku v jediném příkazu.

Využití dat

Jak už je zřejmé z dosavadního textu, tak census.gov poskytují podrobné statistiky, které jsou nesmírně důležité pro průmyslová odvětví a komunity. Obchodní sdružení, obchodní komory a podniky spoléhají na tyto informace pro ekonomický rozvoj, obchodní rozhodnutí a strategické plánování.

Reálné příklady využití v praxi

Na webu census.gov lze najít sekci “Real-Life Use Cases”, kde je shrnuto šest reálných příkladů využití poskytnutých dat. Níže uvádím tři vybrané příklady:

1. Přehodnocení stávajícího většího podniku – výrobce užitkových vozů

Výrobce užitkových nákladních vozidel pravidelně přezkoumával svou síť prodejců a opravárenských zařízení po celých USA. Byli rádi, že většina jejich zařízení vykázala vysoké skóre spokojenosti zákazníků z průzkumů, které provedli se svými zákazníky, ale byli zklamáni, když viděli, že někteří nedělali tak dobře. Počty podniků (instalatérské a elektroinstalační firmy), které obvykle používaly svá vozidla v oblastech pokrytých službami, byly zjištěny (na mapě) pomocí obchodních údajů ze sčítání lidu. Nahoře překryli mapu svých servisních středisek a odhalili oblasti s mnoha potenciálními zákazníky. Také si všimli, že některé oblasti služeb jejich zařízení s nedostatečným výkonem se překrývaly s jinými oblastmi. Pracovníci plánování dokázali přesvědčit manažery, že je třeba zlepšit podnikové procesy pomocí údajů ze sčítání. Aby lépe sloužili svým trhům, dohodli se, že některá zařízení by měla být přesunuta a měla by být otevřena nová zařízení. Hodnocení spokojenosti zákazníků se dramaticky zvýšilo v době, kdy byla dokončena další roční analýza.

cbb-plumbing-knox-county — Obrázek 8: Ukázka reálného využití; zdroj: census.gov

2. Formování daňové politiky – daně z cigaret v Marylandu

Stát Maryland zvažoval zvýšení daní z cigaret a jiných tabákových výrobků. Stát se obával nejen dopadu na spotřebitele tabákových výrobků (a toho, jak by toto zvýšení mohlo ovlivnit schopnost zákazníka je koupit), ale také dopadu na společnosti, které prodávají tabákové výrobky ve státě. Státní zaměstnanci použili údaje o produktových řadách z ekonomického sčítání ke klasifikaci typů dotčených podniků a ke stanovení rozsahu účinků. Tato čísla odhalila, že obchody s potravinami jsou nejoblíbenějšími prodejci tabákových výrobků v Marylandu, což představuje 18,1 procenta (121,2 milionu USD) z celkového prodeje. S využitím údajů Census Bureau o velikosti firmy zjistili, že drtivá většina obchodů s potravinami zaměstnává méně než pět lidí. Po studii údajů se státní úředníci rozhodli nezvýšit tyto daně kvůli možným negativním dopadům na malé podniky.

3. Otevření nové malé firmy – prodejna kol v Portlandu v Oregonu

Úspěšný špičkový výrobce komponentů pro horská kola zvažoval otevření vlastního obchodu s jízdními koly, aby mohl prodávat své výrobky i horská kola a další příslušenství. Identifikoval potenciální zákazníky (mladé profesionály se středním až vysokým středním příjmem domácnosti) pomocí údajů z průzkumu ACS. Použil údaje ze sčítání, aby určil umístění obchodů se sportovními potřebami (NAICS 451110, který zahrnuje obchody s jízdními koly). Tato zjištění nejen zavedla potenciální konkurenty pro jeho společnost, ale také podniky, se kterými mohl spolupracovat otevřením pronajatého oddělení ve větším obchodě. Byl také schopen porovnat mezd na zaměstnance, výnosy na zaměstnance a další statistiky pro devět oblastí, které zvažoval, pomocí statistik trhu ze sčítání lidu, což mu poskytlo lepší pochopení jeho oboru a toho, co by měl očekávat od svých zaměstnanců. Tyto údaje byly použity v jeho podnikatelském plánu a žádosti o půjčku na počáteční kapitál, kterou předložil místnímu věřiteli pro malé podniky.

Závěr

Census.gov je nesmírně důležitý web nejen pro jednotlivé uživatele v US či v zahraničí, ale i pro další externí informační zdroje, které spoléhají na tyto data. Posláním Úřadu pro sčítání lidu je sloužit jako přední poskytovatel kvalitních údajů o svých lidech a ekonomice. Pro jednotlivé uživatele může být tento informační zdroj zajímavý zejména svojí jednoduchostí a vytvářením specifických dashboardů či reportů přes poskytované nástroje.

Nad fundamenty portálu census.gov lze pohlížet z české perspektivy jako nad CZSO, nicméně oba portály se ve výsledné podobě poskytovaných informací mírně liší. Např. CZSO nenabízí souhrnné specifické reporty pro podnikatele dle lokality a odvětví, ale nabízí jiný typ reportů (např. statistický bulletin dle kraje).

Zdroje

UNITED STATES CENSUS BUREAU. Census Data API User Guide. Census.gov [online]. United States Census Bureau, 2021 [cit. 2021-5-8]. Dostupné z: https://www.census.gov/content/dam/Census/data/developers/api-user-guide/api-guide.pdf
UNITED STATES CENSUS BUREAU. Guidance for Economic Census Data Users [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/programs-surveys/economic-census/guidance.html
UNITED STATES CENSUS BUREAU. QuickFacts [online]. [cit. 2021-5-8]. Dostupné z: https://www.census.gov/quickfacts/
UNITED STATES CENSUS BUREAU. Census Business Builder [online]. [cit. 2021-5-8]. Dostupné z: https://cbb.census.gov/

Data.gouv.fr – štátny zdroj informácií Francúzska

Autor:

cesa02

-

22.7.2021

0

Úvod

V dnešnej dobe, ktorá poskytuje množstvo dostupných informácií je čím ďalej náročnejšie orientovať sa, ktoré zdroje na získavanie informácii je potreba si zvoliť. S neustále narastajúcimi zdrojmi, ktoré internet poskytuje je časovo náročné vybrať si práve tie zdroje, ktoré budú obsahovať presne informácie, ktoré potrebujeme a ich vypovedajúca hodnota je pravdivá.

Informačný zdroj data.gouv.fr

Tento post popisuje platformu slúžiacu na šírenie verejných údajov francúzskeho štátu “data.gouv.fr”, ktorej prvá verzia bola vyvinutá agentúrou Logica pod vedením predsedu vlády Francoisa Fillona a spustená 5.12.2011. V decembri 2013 bola spustená druhá verzia spoločnosťou Etalab.

Nové stránky sú však už vyvíjané interne, založené na bezplatnom softvéri “Comprehensive Knowledge Archive Network” (CKAN) vyvinutom prostredníctvom Open Knowledge Foundation. Od roku 2014 je stránka vyvíjaná na špecifickom softvéri s názvom udata. Zdrojový kód softvéru uData je publikovaný na serveri Github a sprístupnený pod GNU Affero General Public License.

Stránka je síce vo francúzskom jazyku a však je možné hore v záložke zmeniť jazyk na angličtinu.

Data.gouv.fr - štátny zdroj informácií Francúzska — Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor]

Vyhľadávanie v repozitári data.gouv.fr

Vyhľadávať požadované informácie v repozitári data.gouv.fr je možné viacerými spôsobmi.

1. Vyhľadávanie pomocou políčka Search, ktoré nám ponúkne najpopulárnejšie data-sety, reuses a organizations, ktoré sa týkajú kľúčového slova, ktoré sme zadali. Ukážeme si to na príklade slova “COVID”.

2. Vyhľadávanie pomocou Data-Setov v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné data-sety, ku dňu 8.5.2021 dostupných 36 885, z repozitára, ktoré si vieme následne zoradiť na základe nasledujúcich kritérií:

Dátum vytvorenia
Množstvo odberateľov
Naposledy modifikované
Množstvo prepoužití
Titul

Po výbere kritérií si vieme zvoliť zoradenie od maxima po minimum alebo naopak. Na danej záložke je možnosť exportu data-setov alebo zdrojov podľa potreby do formátu csv.

V danej sekcii je taktiež možné data-sety filtrovať na základe nasledujúcich filtračných podmienok:

Organizácií
Badges
Tags
Licencií
Časového pokrytia
Priestorového pokrytia
Teritoriálnej granularity
Formátov
Podľa frekvencii prepužití

Aby sme správne porozumeli čo sa pod danými filtračnými podmienkami skrýva uvedieme si 5 najčastejšie používaných hodnôt pre jednotlivé filtračné podmienky. Tieto hodnoty vrátane filtračných podmienok ponecháme v anglickom jazyku aby nedošlo k zmene vypovedajúcej hodnoty kvôli nepresnému prekladu. V tabuľke budú taktiež znázornené počty data-setov, ktoré budú zobrazené po zafiltrovaní.

Organizations
Values	Counts
Departmental Directorate of the Cher Territories	1017
Departmental Directorate of Territories and the Sea of the Somme	999
Departmental Directorate of Ariège Territories	908
Ile-de-France region	883
Datalocal resource center	759

Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor]

Badges
Values	Counts
C³	361
Openfield 16	96
Nec Mergitur	54
Base Local Address	12
Reference Data	9

Tabuľka 2: Filtrovanie podľa Badges [zdroj tabuľky: autor]

Tags
Values	Counts
open-data	15810
gateway-inspires	15727
geoscientific-information	5164
cadastral planning	5018
land-use	4641

Tabuľka 3: Filtrovanie podľa Tags [zdroj tabuľky: autor]

Licenses
Values	Counts
Open License / Open License version 2.0	22857
Open License / Open License	5448
Open Data Commons Open Database License	3758
License Not Specified	3257
Other (Attribution)	136

Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor]

Temporal coverage
Values	Counts
From 01/01/0199	N/A
Till 12/31/2108	N/A

Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor]

Territorial granularity
Values	Counts
Other	17374
French town	1564
Country	924
French country	600
French intermunicipal (EPCI)	556

Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor]

Formats
Values	Counts
json	24391
shp	20256
csv	15126
zip	13824
document	4988

Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor]

Known reuses
Values	Counts
Never reused	32204
Little reused	1301
Quite reused	80
Heavily reused	56

Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor]

Spatial coverage
Values	Counts
World	7092
European Union	7005
France	6959
Metropilitan France	3674
Occitania	1011

Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor]

3. Vyhľadávanie pomocou Reuses v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné reuses, ku dňu 8.5.2021 dostupných 2 654, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre data-sety kritériá navyše doplnené o data-sety. Reuses taktiež zobrazujú z koľkých data-setov sú zhotovené.

Rovnako ako aj pre data-sety aj reuses vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:

Organizations
Badges
Type
Tags
Datasets
Followers

4. Vyhľadávanie pomocou Organizations v hornej časti obrazovky. Táto sekcia nám ponúka všetky dostupné organizácie, ku dňu 8.5.2021 dostupných 2 816, z repozitára, ktoré si vieme následne zoradiť na základe rovnakých kritérií ako pre reuses kritériá doplnené o reuses.

Rovnako ako aj pre reuses aj organizations vieme filtrovať a však k dispozíciu sú len nasledujúce filtračné kategórie:

Datasets
Badges
Reuses
Followers

Ďalšími dostupnými zdrojmi dát, ktoré je možné využiť v rámci data.gouv.fr sú nasledujúce dokumentácie:

Technické dokumentácie dostupné na: https://doc.data.gouv.fr/

Open data guides dostupné na: https://guides.etalab.gouv.fr/

Pre prehľadnosť je možné využiť dashboard:

Pridávanie do repozitára data.gouv.fr

Webový portál neslúži len na dohľadávanie informácií ale taktiež umožnuje informácie nahrávať. Nahrávanie je možné už hore zmienených datasetov, reuses a organizácií .

Podmienkou nahrávania informácii je však registrácia a následné prihlásenie na webový portál.

Závěr

Webový portál data.gouv.fr je globálny register, ktorý obsahuje primárne dáta týkajúce sa francúzska ako krajiny. Ucelené oblasti informácií, ktoré chceme dohľadať vieme pekne filtrovať na základe datasetov a zoradiť si ich podľa potreby. Jedná sa o otvorenú platformu pre francúzske verejné informácie. Na príklade môžeme vidieť, že množstvo aktuálne publikovaných informácii alebo čerstvo pridávaných informácií sa týka najmä COVID problematiky a dopadmi, ktoré na Francúzsko táto pandémia má. Cieľom data.gouv.fr však nie je poskytnúť informácie len občanom francúzska ale rovnako aj ostatným užívateľom, ktorí sa chcú dozvedieť viac, či už o politických záležitostiach francúzska ale rovnako aj kultúre, ekonomike, práve, transporte alebo ostatných oblastí týkajúcich sa francúzska obsiahnutých vo viac ako 36 000 datasetov.

Zdroje

[1] data.gouv.fr – Registry of Research Data Repositories [online]. [cit. 8.05.2021]. Dostupné z: https://www.data.gouv.fr/en/

Zoznam obrázkov

Obrázok 1: Úvodná stránka data.gouv.fr a možnosti prekladu [zdroj obrázku: autor] 1

Obrázok 2: Úvodná stránka data.gouv.fr vyhľadávanie v repozitári pomocou Search [zdroj obrázku: autor] 2

Obrázok 3: Dashboard pre data.gouv.fr [zdroj obrázku: autor] 5

Obrázok 4: Nahrávanie dát do data.gouv.fr [zdroj obrázku: autor] 6

Zoznam tabuliek

Tabuľka 1: Filtrovanie podľa Oragnizations [zdroj tabuľky: autor] 3

Tabuľka 2: Filtrovanie podľa Badges [zdroj tabuľky: autor] Tabuľka 3: Filtrovanie podľa Tags [zdroj tabuľky: autor] 3

Tabuľka 4: Filtrovanie podľa Licenses [zdroj tabuľky: autor] 3

Tabuľka 5: Filtrovanie podľa Temporal coverage [zdroj tabuľky: autor] 4

Tabuľka 6: Filtrovanie podľa Territorial granularity [zdroj tabuľky: autor] 4

Tabuľka 7: Filtrovanie podľa Territorial Formats [zdroj tabuľky: autor] 4

Tabuľka 8: Filtrovanie podľa Known reuses [zdroj tabuľky: autor] 4

Tabuľka 9: Filtrovanie podľa Spatial coverage[zdroj tabuľky: autor] 4

Europeana – kultúrne bohatstvo Európy pod jednou strechou

Autor:

Lenka Brandová

-

7.7.2021

0

Úvod

Krajiny silne závislé na príjmoch z odvetvia cestovného ruchu dnes čelia náročným chvíľam. COVID-19 spustil jednu z najväčších hospodárskych kríz, akú kedy svet zažil. Európska komisia preto zintenzívnila svoju podporu sektora cestovného ruchu a širokej verejnosti poskytla príležitosti na objavovanie rozmanitej kultúry a prírody krajín v rámci Európy. [1]

Sprístupnenie kultúrneho dedičstva Európy verejnosti dnes napomáha v rade spôsobov a miest, kde sa spoločnosť k cestovaniu nemôže a nedokáže dostať. Požívatelia portálu Europeana sú odľahčení od prekážok reality a s pokojom skúmajú významné kultúrne miesta, objekty, umelecké diela a príbehy viažuce sa k európskym krajinám. [2]

Portál Europeana spája ľudí rôznych kultúr či generácií tým, že im pomáha zdieľať ich osobné príbehy viažuce sa k udalostiam ako 1. svetová vojna, Pád železnej opony r. 1989 a i.. Pôvodné príbehy v kombinácii so známymi historickými rozpravami a faktami združujú spomienky osôb s bohatou európskou históriou pod jednou strechou. K dnešnému dňu bolo zozbieraných 50 000 objektov a príbehov týkajúcich sa 1. svetovej vojny. [2]

1. Europeana

Europeana aktívne podporuje online dostupnosť kultúrneho dedičstva a jeho opätovné využitie dnes už takmer 14. rok. Tvrdá práca v súčasnosti prináša svoje zrelé ovocie v podobe viac ako 58 miliónov zdigitalizovaných kultúrnych predmetov z 3 700 knižníc, archívov, múzeí a zbierok. Obsahová stránka portálu odráža európske dejiny z pravekej histórie až k súčasnosti pokrývajúc rôzne témy z umenia a módy až k fotografii a športu počnúc. Portál Europeana poskytuje svoje služby bezplatne a medzi jej primárnych používateľov radíme učiteľov spolu so študentmi. Základnú štruktúru portálu zachytáva obrázok 1. [1] [3]

Europeana - kultúrne bohatstvo Európy pod jednou strechou — Obrázok 1: Základná štruktúra portálu Europeana [2]

1.1 3D obsah portálu

Portál disponuje obvyklým textovým či grafickým obsahom a svojim používateľom tiež ponúka audio či video záznamy. Osoba je v ňom dokonca schopná dohľadať 3D reprezentáciu historickej pevnosti či objektu, viď obrázok 2.

Zobrazenie 3D modelu dokáže používateľ upravovať na základe svojich osobných preferencií. Okrem základných funkcionalít nastavenia akými sú priblíženie, oddialenie a 360° otáčanie mu portál Europeana ponúka detailnú ukážku miestností, ktorou pevnosť The Peñíscola Castle disponuje. Po zvolení niektorého z číselných indexov sa 3D ukážka automaticky zameria na vybranú časť pevnosti. Používateľ tak dokáže vstrebať aj tie najmenšie detaily, ktorými historická stavba dominuje. Prehliadku pevnosti sprevádza tiež zvukový komentár objasňujúci k čomu daná miestnosť označená číselným indexom v minulosti slúžila. Portál Europeana disponuje hneď niekoľkými jazykovými variantami, v ktorých si osoba môže historický výklad vypočuť. UI prostredie takéhoto štýlu získavania informácií zobrazujú obrázky 3-4.

Každý nájdený objekt je okrem vizuálnej či zvukovej ukážky doplnený o základný popis hlavných faktov, ktoré používateľa môžu zaujímať, viď obrázok 5. Výsledky hľadania majú tiež presne špecifikované pravidlá ich zdieľania a opätovného použitia.

Jeden príkaz – mnoho výsledkov, aj týmto štýlom možno opísať portál Europeana. Osoba zameraná na konkrétnu tematiku je schopná získať obsiahle informácie o mnohých objektoch v krátkom časovom úseku, vďaka automatizovanému procesu hľadania, viď obrázok 6.

Portál Europeana dopĺňa výsledky hľadania o detailnú charakteristiku ich technických či historických metadát. V prípade pevnosti The Peñíscola Castle sú uvedené informácie o časovom období, dátume vytvorenia digitálnej podoby objektu či proveniencie, viď obrázok 7.

V neposlednom rade je používateľovi umožnené mapové zobrazenie nájdeného objektu s presnými zemepisnými súradnicami, viď obrázok 8.

1.2 Textový obsah portálu

Textový obsah portálu Europeana je vo veľkej miere zastúpený novinovou tlačou. Používateľovi je sprístupnené filtrovanie možností hľadania výsledkov podľa požadovaného dátumu či jazyka, viac v kapitole 1.4. Reálnu ukážku nemeckej tlače z apríla r. 1881 zobrazujú prílohy obrázok 9-10. V ľavom bočnom panely sa používateľovi automaticky zobrazí anotačný blok, ktorý mu zľahčuje orientáciu v tlačenom texte novín. Osoba môže voľne listovať stránkami tlače a ich vizuálnu ukážku prispôsobovať vlastným preferenciám. V prípade, že osoba pátra po špecifickom výraze, je možné proces hľadania drasticky skrátiť a miesto prechádzania naprieč všetkými stranami novín je možné hľadaný výraz vložiť do textového poľa, ktoré automaticky zobrazí nájdené výsledky, ak je hľadaný pojem v tisku prítomný. Praktickú ukážku znázorňuje príloha obrázok 10, kde dochádza k hľadaniu nemeckého pojmu „Anzeige“ naprieč novinovým textom.

Obdobne ako tomu je vo vyššie uvedenom príklade hľadania 3D objektu pevnosti The Peñíscola Castle, aj v prípade textového obsahu portál Europeana zaznamenáva detailnú charakteristiku metadát, akou je napr. jazyk novinového výtlačku, rozsah či dátum vydania, viď obrázok 11.

1.3 Video, Audio obsah portálu

Video či audio záznamy sú v portáli Europeana zastúpené v početnom množstve rôznych tematík, počnúc od hudobných koncertov až po záznamy z 1. svetovej vojny. Súčasťou portálu je tiež integrovaný video/audio prehrávač, ktorý používateľom zaručuje pohodlné prezeranie výsledkov hľadania. Obrázkové prílohy 12-13 slúžia ako ukážka video záznamu z obdobia 1. svetovej vojny na území bývalého ČSR. Obrázok 12 obsahuje zoznam kľúčových slov, pod ktorým je možné dané video nájsť. Naopak obrázok 13 reprezentuje metadáta, ktoré v prípade video záznamu uvádzajú jazyk a produkčnú krajinu filmu, dátum vytvorenia a miesto udalosti.

1.4 Prehľadávanie portálu

Používateľ je na portáli Europeana schopný prezerať všetky položky rôzneho druhu ešte skôr než začne s procesom vyhľadávania informácií. Portál Europeana dáta kategorizuje do piatich typov: [7]

Text: knihy, listy, archívne papiere, dizertačné práce, básne, novinové články, faksimile, rukopisy a hudobné podklady
Obrázky: obrazy, kresby, výtlačky, fotografie, obrázky múzejných objektov, mapy, grafických vzorov, plánov a hudobného notácie
Video: filmy a televízne programy
Zvuk: pásky, disky a rozhlasové vysielania
3D: virtuálne 3D reprezentácie objektov architektúry alebo miest

UI prostredie portálu je dostatočne intuitívne a logické. Osobám poskytuje prehľad o zastúpenom type médií vo vybranej zbierke (Art, Fashion, Sport a i.), možnostiach opätovného použitia nájdených výsledkov pre osobné účely či aktuálne počty objektov vo zvolených kategóriách. Obrázky 14-16 znázorňujú proces prehľadávania objektov v zbierke Arts.

V kapitole 1.2 zaoberajúcou sa textovým obsahom portálu je uvedený príklad nemeckej tlače z apríla r. 1881. V prípade, kde osoba hľadá špecifický dátum vydania je možné využiť rozšírenú ponuku filtrovania výsledkov, a to spôsobom zadania konkrétneho dátumu či iných osobných preferencií, ako znázorňuje príloha na obrázku 17.

1.5 Vyhľadávanie v portáli

Portál Europeana disponuje priamym spôsobom získavania nových informácií. V prípade, kde osoba pozná predmet svojho hľadania sa ponúka použiť nasledovný princíp: [7]

Who: meno osoby resp. tvorcu. Príkaz „who: Vincent van Gogh“ vyhľadá umelecké diela svetoznámeho maliara. Naopak, týmto štýlom nie sme schopní získať záznamy o jeho osobnom živote.
What: typ položky, predmetu alebo kľúčového slova hľadanej veci. Príkaz „what: Art Nouveau“ zobrazí umelecké diela, budovy a pamiatky Art Nouveu.
Where: názov miesta. Príkaz „where: Milan“ zobrazí objekty, ktorých vznik sa datuje k územiu Milána alebo sa aktuálne v Miláne nachádzajú. Portál Europeana počíta aj s jazykovou diferenciou, a preto v prípade príkazu where: Milano alebo Mailand či Milanas zobrazí používateľovi rovnaké položky viažuce sa k danej geografickej oblasti.
When: dátum. Príkaz „when: 1984“ vyhľadá položky z r. 1984. Obdobným príkazom je „YEAR:1984“ alebo „YEAR:[1525 TO 1527]“, ktorým môžeme vymedziť nami požadované časové obdobie.

1.5.1 Pokročilé vyhľadávanie

Zaužívané techniky pokročilého hľadania sa ničím nelíšia ani na portáli Europeany. Osoba dokáže vyhľadať frázu za pomoci úvodzoviek či využiť známe operátory: [7]

AND: nájde výsledky, ktoré obsahujú všetky zadané slová, napr. salt AND pepper. Operátor je možné nahradiť postupnosťou znakov && alebo +.
OR: nájde výsledky, ktoré obsahujú aspoň jedno zo zadaných slov, napr. salt OR pepper. Operátor je možné nahradiť postupnosťou znakov ||.
NOT: vylučuje výsledky, ktoré obsahujú zadané slovo, napr. salt NOT pepper. Operátor je možné nahradiť znakom – alebo !.

V prípade potreby portál Europeana tiež podporuje funkcionalitu tzv. zgrupovania za pomoci využitia zátvoriek, napr. “(salt AND pepper) AND cooking”.

Ďalšie operátory pokročilého vyhľadávania záznamov, akými sú * alebo ? či ~ sú portálom Europeana podporované v plnom rozsahu: [7]

Operátor *: nájde slová s ľubovoľným počtom písmen, napr. „ca*“ zobrazí položky ako cat, cap, cane, cable, canary a i..
Operátor ?: nahrádza jedno písmeno v zadanom slove, napr. „ca?e“ zobrazí položky ako cane, care, case a i.. Operátor ? nachádza využitie najmä v prípadoch, v ktorých si osoba nie je istá správnosťou pravopisu.
Operátor ~: nájde položky s podobným pravopisom, napr. „text~“ zobrazí položky ako test, texts a i..

1.6 Využitie portálu

Portál Europeana disponuje bohatým obsahom rozličných tematík. Ako už vyššie kapitoly uvádzajú, osoba dokáže získať poznatky z historickej novinovej tlače alebo si svoje vedomosti prehĺbiť v starovekých pevnostiach. Okrem iného však portál tiež uchováva archívne zábery z módnych mól popredných návrhárov, ktorých výsledky používateľ dokáže detailne filtrovať na základe výberu:

Dizajnéra
Typu položky ako haute couture, fashion show, fashion collection či typ odevu/doplnkov/obuvi
Farby
Orientácie obrázka
Veľkosti obrázka
Jazyku
Inštitúcie
Formátu súboru

Osoba má na výber z celkového počtu 43 zbierok rôznych tematík abecedne zoradených. Portál tiež ponúka vyhradenú sekciu pre pedagógov, študentov či rodičov, ktorá disponuje selekciou overených vzdelávacích zdrojov pravidelne aktualizovaných na základe diania vo svete.

Naše kultúrne dedičstvo spája minulosť, súčasnosť a budúcnosť. Na podporu cestovného ruchu, EÚ preto vyhradila na portáli Europeana osobitnú časť: Discovering Europe , ktorá používateľa prevedie virtuálnou cestou po Európe z pohodlia jeho domova. [1]

Posledné výskumy uvádzajú zistenie, až 40% turistov si dnes vyberá svoju dovolenkovú destináciu na základe jej kultúrneho dedičstva a histórie. [1]

Zoznam použitej literatúry

[1] The Europeana platform [online]. Oficiálna webová stránka European Commission. URL: https://digital-strategy.ec.europa.eu/en/policies/europeana. Cit. 2021-03-21.

[2] Europeana – the case for funding [online]. Dostupné z: http://www.eblida.org/News/Europeana%20-%20The%20Case%20for%20Funding.pdf. Cit. 2021-03-21.

[3] Nuno Freire. Data interoperability in cultural heritage: the Europeana approach [online]. EUDAT Conference, Rím, Október 2013 Dostupné z: https://www.eudat.eu/sites/default/files/NunoFreire.pdf. Cit. 2021-04-05.

[4] Castillo de Peñíscola │Castellón │ España [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/181/share3d_796. Cit. 2021-04-05.

[5] Anzeiger zum Pustertaler Boten – 1881-11-04 [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/9200333/BibliographicResource_3000115223398. Cit. 2021-04-05.

[6] Slavný návrat 1. pl. Mistra Jana Husi do vlasti 2. II. 1920 – 1881-11-04 [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/item/08615/3900769_01. Cit. 2021-04-05.

[7] Searching and Browsing [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/en/help/search-tips. Cit. 2021-04-05.

[8] Art [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/collections/topic/190-art. Cit. 2021-04-05.

[9] Newspapers [online]. Oficiálna webová stránka Europeana. URL: https://www.europeana.eu/sk/collections/topic/18-newspapers. Cit. 2021-04-05.

MarineTraffic: sledujte polohu plavidel nejen v rámci oceánů

Autor:

frim00

-

5.7.2021

0

Úvodní představení

Společnost MarineTraffic (2021a) je světový leader v poskytování informací o poloze plavidel a námořním zpravodajství. Společnost si dává za cíl zjednodušit přístup k užitečným datum.

Obr. 1 Logo společnosti MarineTraffic(2019)

Hlavní přidaná hodnota, kterou společnost vytváří spočívá v monitorování pohybu plavidel. MarineTraffic staví svůj úspěch na sběru dat ze celé sítě pobřežních přijímačů AIS¹ doplněných informace ze satelitů. Takto sesbíraná data jsou zpracována a integrují informace z dalších komplementárních zdrojů. Cílem je poskytnout užitečné informace o lodních aktivitách, které jsou aplikovatelné v zasilatelském, obchodním a logistickém průmyslu.

Hlavní kanceláře společnosti se nacházejí v Spojeném království, Řecku a Singapuru. Společnost má také lokální zastoupení u všech hlavních globálních námořních uzlů, tak aby mohla poskytovat služby na míru lokálních požadavků. MarineTraffic prohlašuje, že je skutečně globálním hráčem s miliony uživatelů jeho služeb.

MarineTraffic se dává za cíl poskytovat transparentní informace a pozitivním způsobem posouvat svět námořní dopravy kupředu. Proto společnost spolupracuje s mezinárodními námořními organizacemi jako je například UNCTAD². Kromě toho MarineTraffic významně spolupracuje s největšími přístavy a rejdařstvími na světě s cílem zlepšit jejich efektivitu.

Na Wikipedii (2020a) heslo MarineTraffic popisuje otevřený komunitní projekt, poskytující informace o pohybech plavidel v reálném čase. Služba byla spuštěna v roce 2007 jako akademický projekt na Egejské univerzitě v Řecku pod vedením profesora Dimitriase Lekkase. Služba je lokalizovaná do 35 jazyků včetně češtiny.

Databáze tohoto projektu obsahuje informace o plavidlech včetně jejich aktuální i historické polohy, rozměry, tonáž nebo například číslo IMO³. Kromě toho mohou uživatelé sdílet fotografie těchto plavidel a navzájem si tyto fotografie hodnotit. Databáze pro finální prezentaci využívá kombinované mapové podklady složené ze služeb Google Maps API a OpenStreetMap.

Základní služba sledování plavidel je poskytována zdarma a zejména pro profesionály jsou nabízený placené prémiové služby. Wikipedické heslo uvádí 600 000 registrovaných uživatelů k roku 2015, ale celkově služba eviduje 2 000 000 unikátních uživatelů měsíčně. Služba je také dostupná formou aplikace pro mobilní zařízení s operačními systémy iOS a Android. (MarineTraffic 2021d)

Jak již bylo zmíněno výše, tak MarineTraffic využívá služby pobřežních AIS přijímačů. Wikipedie dále upřesňuje, že těchto je ve více než 140 zemích světa celkově více než 18 000 přijímačů, a které jsou spravovány dobrovolníky zapojenými do tohoto projektu. Což činní službu velmi závislou na své komunitě. K 27.3.2021 databáze evidovala pohyby 224 533 plavidel během posledních 24 hodin. Protože se má projekt akademické kořeny tak se společnost MarineTraffic kromě rozvoje samotné služby významně věnuje také výzkumu včetně publikování ve spolupráci s univerzitami. Věnuje se zejména oblastem databázových systémů a AI. (MarineTraffic 2021f)

Rešeršní možnosti

Celý produkt této společnost lze rozdělit na dvě velké části, které následně rozlišují takým způsobem lze v této databázi vyhledávat. Těmito dvěma částmi jsou Online services a Data services, přesněji API⁴ rozhraní k celé databázi. Přesněji Online services nabízejí uživatelsky přívětivé rozhraní, skrze které se lze dotazovat, analyzovat či vizualizovat podkladová data obsažené v Data services. Omezená funkcionalita Online services je nabízena zdarma, avšak přístup k ryzím datům skrze Data services je kompletně zpoplatněn.

V rámci seznámení se MarineTraffic neměl autor této práce možnost si prakticky otestovat práci s Data services. Přesto lze předpokládat že jsou touto cestou zpřístupněny všechny informace obsažené v databázi, a to včetně těch které nejsou jinak zpřístupněny skrze Online services. API rozhraní je primárně cíleno pro byznysové užití. Dle dokumentace, API pomocí HTTP⁵ protokolu na základě dotazu vrací odpověď ve formátu XML⁶, CSV⁷ nebo JSON⁸.

Obr. 2 ukázka XML odpovědi (MarineTraffic 2021b)

Nyní se však soustřeďme na možnosti vyhledávání pomocí Online services. Na hlavním vstupním bodu webové stránky je uživateli rovnou prezentována Živá mapa zobrazující informace, které databáze obsahuje k zobrazené oblasti. Tedy všechny plavidla, přístavy či další významné entity které se aktuálně nacházejí v zobrazené lokalitě. Samozřejmě jednotlivé body na mapě lze dále rozkliknout a zobrazit si tak detailní informace k dané entitě.

Obr. 3 ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla (MarineTraffic 2021i)

V rámci Živé mapy lze vyhledávat entity nejen skrze mapu, ale také pomocí vyhledávacího pole. V uživatelské nápovědě jsem nenalezl informaci, že vyhledávací pole podporovalo jakýkoliv zvláštní vyhledávací syntax či operátory. Uživatelské rozhraní nabízí pouze filtrování výsledků tyto skupiny entit:

Plavidla
Přístavy
Oblasti
Moje flotila
Moje poznámky
Společnosti

Stanice
Majáky
IMO
MMSI⁹
Fotografové
Zprávy

Obr. 4 ukázka uživatelského rozhraní pokročilého vyhledávání (MarineTraffic 2021h)

Online services nabízejí k vyhledávání, kromě jednoduchého vyhledávacího pole v rámci Živé mapy, pokročilé vyhledávání Explore, kde lze vyhledávat pomocí velkého množství parametrů které databáze eviduje. Kvantitativní parametry lze dále omezovat na vybrané intervaly a kvalitativní parametry zase pomocí operátorů in a not in. Případně lze kombinovat vyhledávaní pomocí vícero parametrů současně. Pokročilé vyhledávání některých entit je však zpoplatněno a stejně tak je zpoplatněn také jakýkoliv export výsledků vyhledávání.

Popis indexu

Typologie dat jsou zde popsány dle členění datasetů nabízených v rámci Data services. Jedná o pět hlavních kategorií, které se dále dělí na 25 skupin, datasetů. (MarineTraffic 2021c)

První kategorie řeší problematiku určení přesné polohy plavidel a obsahuje následující data sety:

Historická trasa plavidla
Pozice plavidel ve statické flotile
Pozice plavidel ve dynamické flotile
Pozice plavidla v přístavu

Pozice plavidla ve vybraných oblastech
Pozice plavidla ve vlastní oblasti
Aktuální pozice plavidla

Druhá kategorie je věnována informačním zprávám a událostem. Plavidla jsou povinna veřejně hlásit určité události. Tato kategorie obsahuje následující data sety:

Volání přístavu (zejména informace o vstupu a opuštění přístavu plavidlem)
Události plavidla (všechny události s vazbou ke konkrétnímu plavidlu)
Volání kotviště (obdoba volání přístavu, ale pro spravovaná kotviště)

Kategorie Data plavidel je věnována detailním informacím a parametrům plavidel:

Fotografie plavidla
Parametry plavidla
Vyhledání plavidla (vrací URI¹⁰ plavidla v rámci databáze MarineTraffic)

Čtvrtá kategorie je věnována plánování plavby:

Předpověď cesty (vrací očekávané průjezdní body, vzdálenosti a čas plavby)
Očekávané příjezdy (vrací seznam plavidel očekávaných v přístavu)
Vzdálenosti přístavů a plavebních cest
Odhadovaná destinace (vrací předpověď 5 nejpravděpodobnějších cílů plavidla)
Odhadovaný příjezd (jako Odhadovaná destinace, ale na základě jiného modelu)
Provoz v přístavu (poskytuje informace o čekacích dobách plavidel)
Očekávaný čas příjezdu do přístavu

Poslední kategorie je věnována správě účtů v rámci celého produktu MarineTraffic:

Změna flotily
Plavidla ve flotile
Flotily

Zůstatek kreditů
Vyprázdnění flotily

Přístup ke všem data setům je zpoplatněn. Přístup lze platit většinou dvěma způsoby. Prvním je kreditový systém, který je dostupný pouze u některých datasetů. Uživatelé si mohou pořídit určitý obnos kreditů které lze následně utrácet za vybrané dotazy skrze API rozhraní. Různé dotazy mohou mít různou cenu. Cenu ovlivňuje volba zdroje, zda se jedná o data ze satelitní sítě AIS nebo ze sítě pobřežních přijímačů AIS. Druhou možností je předplatné, které je dostupné u všech datasetů. Pořízení předplatného je však komplikovanější vzhledem k tomu že je potřeba napřímo kontaktovat poskytovatele. Vždy se jedná o individuální nabídku, a nikoliv službu s předem stanovenou cenou.

Databáze eviduje pozice pohybujících se plavidel v 2 minutových intervalech. U nehybných plavidel je evidována jejich poloha jen každých 20 minut. Databáze sbírá data primárně ze dvou zdrojů. Jak již bylo zmíněno jedním je satelitní přijímače AIS vysílání a tím druhým je pobřežní sít přijímačů AIS vysílání. MarineTraffic vybudoval s pomocí své komunity největší síť přijímačů AIS vysílání na světě. Jednotlivci jsou motivováni k tomu, aby se do této komunity zapojili dvěma způsoby. Prvním je že současní vlastníci AIS přijímačů, kteří se zapojí do této sítě zdarma obdrží navýšení jejich úrovně předplatného služeb MarineTraffic. Naopak těm, kteří nemají AIS přijímač, jsou oblasti, která doposud není dostatečně pokrytá, těm MarineTraffic takový přijímač zdarma poskytne. (MarineTraffic 2021g) Vedlejším zdrojem dat, fotografií, jsou uživatelé–fotografové, kteří je dobrovolně do databáze nahrávají své fotografie konkrétních lodí.

Příklady užití

Pro identifikaci některých příkladů využití služby MarineTraffic byl kontaktován Jan Poláček ze společnosti Czechoslovak Ocean Shipping, s.r.o. přední české zasilatelské společnosti. Společnost využívá placenou variantu služby Online services, ale již nikoliv přímé rozhraní databáze Data services. Pan Poláček oceňuje zejména jednoduchost použití a přehlednost, když prezentuje výstupy z této služby zákazníkům. Využívají polohu plavidel pro sledování zásilek celou dobu cesty a pružně reagovat na případné zpoždění plavidla upravovat návazné články dopravního řetězce zásilky až k zákazníkovi. Není to je příklad námořní dopravy. V současné době existuje trend sledování zásilek i letecké či automobilové dopravě.

Celý projekt MarineTraffic pochází z akademického prostředí. A zde nachází také mnoho příkladů užití. A například i přístup k Data services lze získat za zvýhodněných podmínek pro akademické užití. Data ze služby MarineTraffic mohou posloužit při manažerských studiích jak ukazuje příklad Martina Jančáka (2018) z Katedry logistiky Fakulty podniko-hospodářské Vysoké školy ekonomické v Praze. Dalšími příklady mohou být pro enviromentální programy studium polární námořní trasy okolo Ruska. Nebo vizualizace hustoty námořní dopravy v kaspickém moři pro geopolitická studia. Za poměrně překvapivé lze označit velmi významné lodní spojení Ázerbájdžánu s Turkmenistánem. Akademické uplatnění této služby je velmi široké. To se ukazuje také na to, že s MarineTraffic spolupracuje sedm univerzit a mnoho specializovaných výzkumných organizací. (MarineTraffic 2021e)

Obr. 5 ukázka využití MarineTraffic pro vizualizaci hustoty provozu v Černém a Kaspickém moři

V neposlední řadě je potřeba zmínit také námořníky samotné, kteří mohou využívat služeb MarineTraffic pro plánování tras i pro samotnou navigaci. V rámci skupiny Online services jsou nabízeny služby jako plánovaní trasy upravené o meteorologickou předpověď, služby odesílání důležitých námořních zpráv formou notifikací v mobilní aplikaci, nebo navigování v přístavišti. Opět, toto je jen krátký výpis několika málo užití této služby, kterých je celkově mnohem více.

Závěr

Závěr je věnován kratičkému srovnání se službou, která téměř dvojčetem k MarineTraffic, a která přesto vůbec nekonkuruje. Tou službou je velice populární švédský Flightradar24. Jedná se službu fungující na stejném principu jako MarineTraffic akorát místo lodí, jak název napovídá, sleduje pohyby letadel. Oba projekty vznikli mezi lety 2006 a 2007. Oba staví na volně šířených identifikačních signálech, které snímá komunitní síť přijímačů. A klíčem k úspěchu obou služeb byla právě agregace a přehledná vizualizace těchto signálů. Obě služby nabízí své základní online služby zadarmo, ale nabízí také prémiové služby a placené API rozhraní databáze. Seznam společných rysů pokračuje i dále. Jedná se skutečně dvojčata.

Přijímání, agregování a následné distribuování AIS vysílání lze jednoduše replikovat. Přesto není mnoho konkurenčních řešení, které by nabízeli obdobnou komplexitu a množství informací. Co se ukazuje jako snadno nenapodobitelné je komunita uživatelů a tvůrců obsahu v rámci služby. Možná i proto, z celé variety služeb, je to právě MarineTraffic, který je dostatečně atraktivní pro významné světové instituce, aby s ním chtěli spolupracovat.

Aktuální případ nákladní lodi, která uvízla v Suezském průplavu a zcela zastavila tak jednu z hlavní námořních tras, dále ukázala sílu online aktualizovaných dat. (Splash 24/7 2021) Novináři z celé světa, mimo jiné i skrze MarineTraffic, neuroticky sledovali několik dní, zda se jedna tečka na mapě dala již do pohybu.

Poznámky pod čarou

1. AIS neboli Automatic identification system je systém pro sledování pohybů lodí. AIS vysílač v kombinaci s námořním radarem jsou základní nástroje pro navigovaní a vyhýbání se kolizím. AIS signálů využívá VTS (vessel traffic services) pro řízení provozu v přístavech. (Wikipedia 2021b)

2. UNCTAD neboli United Nations Conference on Trade and Development, česky Konference OSN o obchodu a rozvoji je jednou z odborných organizací OSN. Její programy jsou zaměřeny na rozvoj obchodu, obchodní a celní politiku, surovinovou politiku a rozmach rozvojových zemí a jejich ekonomickou integraci. (Wikipedia 2019)

3. Číslo IMO neboli International Maritime Organization number je unikátní identifikátor plavidel, jejich registrovaných majitelů či správcovský společností. (Wikipedia 2021e)

4. API neboli Application Programming Interface v informatice označuje rozhraní, které umožňuje interagovat vícero systémům či aplikacím mezi sebou. (Wikipedia 2021a)

5. HTTP neboli Hypertext Transfer Protocol je internetový protokol pro komunikaci klientů s webový servery, zejména pomocí hypertextových dokumentů. (Wikipedia 2021d)

6. XML neboli Extensible Markup Language je značkovací jazyk. Je snadno čitelný i strojově spravovatelný. Jedná se o jazyk příbuzný HTML. (Wikipedia 2021h)

7. CSV neboli Comma-separated values je jednoduchý formát zápisu tabulkových dat. (Wikipedia 2021c)

8. JSON neboli JavaScript Object Notation je (Wikipedia 2021f)

9. MMSI neboli Maritime Mobile Service Identity je devítimístné unikátní identifikační číslo všech námořních vysílačů (plavidel i pobřežních stanic). Tento identifikátor je využívám i v rámci AIS. (Wikipedia 2020b)

10. URI neboli Uniform Resource Identifier je textový řetězec, který umožňuje jednoznačně určit umístění a název odkazovaného objektu. (Wikipedia 2021g)

Literatura

JANČÁLEK, Martin, 2018. Dovoz tuňákových výrobků z Latinské Ameriky [online]. B.m. [vid. 2021-03-30]. Vysoká škola ekonomická v Praze. Dostupné z: https://vskp.vse.cz/75733

MARINETRAFFIC, 2019. MarineTraffic company logo [online] [vid. 2021-03-27]. Dostupné z: https://mk0snopwdropsolwypn8.kinstacdn.com/wp-content/uploads/2019/11/MarineTraffic_Global-Ship-Tracking-Intelligence_BG-White-1-1.png

MARINETRAFFIC, 2021a. About company [online] [vid. 2021-03-26]. Dostupné z: https://www.marinetraffic.com/cs/p/company

MARINETRAFFIC, 2021b. AIS API Documentation [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/ais-api-services/documentation/api-service:ps01

MARINETRAFFIC, 2021c. AIS API Services [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/ais-api-services

MARINETRAFFIC, 2021d. Mobile apps [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/cs/mobile-apps

MARINETRAFFIC, 2021e. Partnerships Archive. MarineTraffic Research [online]. [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/research/partnership/

MARINETRAFFIC, 2021f. Reserch. MarineTraffic Research [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/research/

MARINETRAFFIC, 2021g. Ship Spotting AIS Receiver – Set up AIS Receiver [online] [vid. 2021-03-30]. Dostupné z: https://www.marinetraffic.com/cs/p/expand-coverage

MARINETRAFFIC, 2021h. Ukázka uživatelského rozhraní pokročilého vyhledávání. MarineTraffic [online]. Dostupné z: https://www.marinetraffic.com/cs/data/?asset_type=vessels&columns=flag,shipname,photo,recognized_next_port,reported_eta,reported_destination,current_port,imo,ship_type,show_on_live_map,time_of_latest_position,dwt,notes&flag_in|in|Czech%20Republic|flag_in=CZ

MARINETRAFFIC, 2021i. Ukázka uživatelského rozhraní základní obrazovky s otevřeným detailem plavidla [online] [vid. 2021-03-27]. Dostupné z: https://www.marinetraffic.com/cs/ais/home/shipid:737721/zoom:14

SPLASH 24/7, 2021. Huge Suez operation frees the Ever Given. MarineTraffic.com [online] [vid. 2021-03-30]. Dostupné z: http://www.marinetraffic.com/en/maritime-news/article/36385

WIKIPEDIA, 2019. Konference OSN o obchodu a rozvoji [online]. [vid. 2021-03-26]. Dostupné z: https://cs.wikipedia.org/w/index.php?title=Konference_OSN_o_obchodu_a_rozvoji&oldid=17415477

WIKIPEDIA, 2020a. MarineTraffic [online]. [vid. 2021-03-27]. Dostupné z: https://en.wikipedia.org/w/index.php?title=MarineTraffic&oldid=996814078

WIKIPEDIA, 2020b. Maritime Mobile Service Identity [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Maritime_Mobile_Service_Identity&oldid=995063085

WIKIPEDIA, 2021a. API [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=API&oldid=1014458682

WIKIPEDIA, 2021b. Automatic identification system [online]. [vid. 2021-03-26]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Automatic_identification_system&oldid=1004657806

WIKIPEDIA, 2021c. Comma-separated values [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Comma-separated_values&oldid=1013831687

WIKIPEDIA, 2021d. Hypertext Transfer Protocol [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Hypertext_Transfer_Protocol&oldid=1014703031

WIKIPEDIA, 2021e. IMO number [online]. [vid. 2021-03-27]. Dostupné z: https://en.wikipedia.org/w/index.php?title=IMO_number&oldid=1008929344

WIKIPEDIA, 2021f. JSON [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=JSON&oldid=1015019090

WIKIPEDIA, 2021g. Uniform Resource Identifier [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=Uniform_Resource_Identifier&oldid=1015064371

WIKIPEDIA, 2021h. XML [online]. [vid. 2021-03-30]. Dostupné z: https://en.wikipedia.org/w/index.php?title=XML&oldid=1014223202

JSTOR: podrobný vhled do on-line superzdroje pro humanitní a společenské vědy

Autor:

Dan Lukeš

-

3.7.2021

0

Co je JSTOR?

JSTOR je digitální knihovna původně především pro akademické potřeby v humanitních a společenských vědách. Online databáze umožňuje fulltextové vyhledávání napříč více než 2600 odbornými časopisy, 100 000 e-knihami a miliony primárních zdrojů. JSTOR nabízí velmi kvalitní zdroje, které jsou povinně podrobeny recenzím odborníků z příslušné vědecké oblasti. Díky dobré pověsti a vysoké kvalitě zdrojů se obsah databáze trvale rozšiřuje o nové obory, např. matematiku, statistiku a techniku.

Primárním cílem JSTORu, při prvním spuštění v roce 1994, bylo vyřešení problémů plynoucích z trvalého růstu odborných publikací a nedostatku místa pro archivaci v univerzitních knihovnách. Digitalizace a centralizace textů vytvořila archiv přístupný odborné veřejnosti z téměř celého světa. V roce 2009 se JSTOR stal jedním z nástrojů neziskové organizace Ithaka (více na Ithaka.org).(JSTOR1)

Požadavkem pro zveřejnění odborného časopisu na této platformě je digitalizace kompletní historie časopisu, tedy od prvního vydání prvního svazku. Naopak nárokem ze strany vydavatelů knih a časopisů je „pohyblivá zeď “, která JSTORu umožňuje zveřejnit plný text publikace v databázi až po uplynutí 3-5 let od vydání. (JSTOR 3 nedatováno; JSTOR 2 nedatováno)

JSTOR nabízí mnoho možností, jak získat přístup k obsahu:

Zdarma a bez registrace: omezená část obsahu je k dispozici komukoliv
Zdarma přes školní nebo veřejnou knihovnu
Individuální účet:
- funkce organizace a uložení citací nebo poznámek
- možnost zdarma přečíst 6 článků každých 30 dní (po dobu pandemie covid-19 je počet článků navýšen na 100)
Neomezená placená verze JPASS pro jednotlivce

Pokud studujete nebo pracujete ve vzdělávací instituci, můžete si individuální účet propojit s účtem Vaší instituce, čímž získáte všechen, Vaší institucí předplácený, obsah z domova. (JSTOR 4 nedatováno)

Základní vyhledávání

Představme si, že jsme v literatuře narazili na jméno Adam Smith a kromě pojmu „neviditelná ruka trhu“ o jeho práci nic neznáme. V takovém případě nám bude stačit základní vyhledávání, které se objeví hned při načtení stránky jstor.org.

JSTOR během zadávání zobrazuje přibližný počet odpovídajících záznamů a navrhuje základní filtrování výsledků. My bychom se rádi seznámili s původní prací Adama Smithe, vybereme proto práce, kde je Adam Smith autorem.

JSTOR: podrobný vhled do on-line superzdroje pro humanitní a společenské vědy — AUTOR, 2021. Obrázek 1 Úvodní stránka [online]. 2021. Dostupné z: jstor.org

Výsledky hledání lze filtrovat pomocí panelu na levé straně. Prostřednictvím filtrování můžeme omezit výsledky na určitou formu dokumentu, vymezit časový úsek vydání, vybrat relevantní obory prací nebo zobrazit pouze dokumenty, u kterých máme fulltextový přístup. Vyhledávací pole na levém panelu přidává možnost dodatečného vyhledávání v množině dokumentů, kde je autorem Adam Smith. Výsledky vyhledávání jsou ve výchozím nastavení seřazeny dle relevantnosti, ale pomocí tlačítka nad výsledky můžeme řazení změnit na chronologické.

Pokud využíváme individuálního účtu a máme ke konkrétnímu dokumentu plný přístup, můžeme si ho v plném rozsahu přečíst, sdílet, vytvořit citaci, uložit do JSTOR Workspace nebo stáhnout ve formátu pdf.

Pokročilé vyhledávání

Pokud máme lepší představu o námi požadované informaci, můžeme využít pokročilé vyhledávání. JSTOR nabízí vytvoření sekvence klíčových slov v rámci polí, kterými jsou autor, titulek, abstrakt a popis obrázku. Pokud takovou oblast nespecifikujeme, proběhne klasické fulltextové vyhledávání. Uživatelsky přívětivá je také nabídka základních operátorů AND, NOT, OR, NEAR/5/10/25.

Pokračujme v příkladu s Adamem Smithem. Po základním hledání jsme zjistily, že angličtina 18. století je nad naše síly, proto už nechceme originální texty. Dále nechceme nic o neviditelné ruce trhu, protože tuto teorii si pamatujeme ze střední školy, a naopak nás zajímá Smith ve spojitosti s volným obchodem. Řekněme, že předmětem našeho zájmu budou knihy v angličtině z aktuálního tisíciletí. Vyhledávací dotaz pro naše kritéria může vypadat například takto:

Poslední dvě pole využijeme, pokud máme detailnější informace a hledáme konkrétní titul. První možností je zadání nazvu knihy, časopisu nebo článku, druhou je jedinečný identifikátor ISBN.

Možnosti vyhledávání pro pokročilé

Pokročilé vyhledávání nám ukázalo, že JSTOR vybízí i začínající uživatele k využívání operátorů. Jakmile si však člověk osvojí základní syntax, může uplatnit efektivní metody i v rámci řádku základního vyhledávání. Díky široké paletě možností dostaneme k dispozici sofistikovanější vyhledávací dotazy.

Co všechno lze tedy využít?

Základní operátory

Uvozovky= pro vyhledání přesné fráze ji vložte do uvozovek (“invisible hand of the market“)

AND = výsledky, která obsahují obě slova (apple AND google)

OR = výsledky, které obsahují jedno nebo obě slova (book OR newspapers)

NOT = výsledky, které neobsahují slovo za operátorem (ink NOT paper)

Závorky = umožňují kombinaci operátorů pro detailní vyhledávání, např. (economy NOT (crisis OR inflation)) vyhledá položky o ekonomice, ale bez zmínek o krizi nebo inflaci

NEAR /5/10/25 = číslice označuje maximální vzdálenost 2 vyhledávaných slov v dokumentu (broom NEAR/10 snitch) (JSTOR 5)

Pokročilé operátory

Podobná slova ~ = přidáním symbolu na konec slova vyhledáme zároveň i obdobně hláskovaná slova, což je vhodné u autorů zahraničních jmen (dostojevksij~) nebo v případě jemných nuancí mezi anglickou a americkou angličtinou (colour~)

Wildcards (? *) = otazník představuje 1 libovolný znak (obdoba žolíka z deskové hry Scrabble) např. wom?n vyhledá woman, women, ale i womqn, pokud se takové slovo v databázi vyskytuje. Na druhou stranu hvězdička je neomezená posloupnost znaků, takže micro* vyhledá microcosmos, mikrobiology, microsoft, microscope atd.

Relevance slov ^ = pomocí ^ upravujeme váhu jednotlivých slov.Dark chocolate^5 znamená, že hledáme informace o hořké čokoládě, ale samotná čokoláda je pro nás pětkrát důležitější (JSTOR 6)

Vyhledávání v polích

Tuto možnost už jsme si vyzkoušeli v pokročilém vyhledáván u Adama Smithe. Rozdílem je, že neklikáme do nabídky polí, ale pro požadované pole píšeme příslušnou zkratku:

au: = autor

ti: = titulek

ca: = popis obrázku

ab: = vyhledá v textu abstraktu

sn: nebo in: = ISSN kód

vo: = číslo svazku

Po osvojení základních zkratek můžeme jít do většího detailu:

la: = vyhledávání pouze konkrétního jazyka (la:eng nebo la:jpn)

ty: = typ dokumentu (ty:fla je dokument v plné délce, ty:brv je recenzí knihy)

cty: = kategorie (cty:chapter pro hledání na úrovni kapitol knih)

(JSTOR 7) (Karlshochschule 2017)

Workspace

Pokud zpracováváme diplomovou práci nebo více odborných prací najednou, uvidíme v nástroji workspace přidanou hodnotu. Pro každý projekt si lze v rámci uživatelského účtu vytvořit složku, do které průběžně ukládáme nalezené použitelné zdroje z JSTORu, ale i různé internetové odkazy mimo naší online knihovnu. Navíc si každou položku můžeme opatřit poznámkami. Při využití zdrojů, nalezených v JSTORu, lze snadno generovat citace pomocí 3 nabízených citačních stylů (MLA, APA a CHICAGO).

Text analyzer

Text analyzer je nástroj stále se nacházející v beta verzi, který již nyní skýtá veliký potenciál. Princip spočívá v nahrání dokumentu, obrázku textu nebo URL odkazu na text. Výsledkem vyhledávání je seznam článků na pravé straně, které se věnují obdobné problematice. Nalezené zdroje můžeme filtrovat na levé straně pomocí odebírání rozpoznaných témat a přidáváním témat vlastních nebo identifikovaných v našem textu. Příjemným překvapením je možnost modifikace důležitosti jednotlivých témat. Osobně považuji nastavování vah u jednotlivých témat za skvělý bonus. Jednak jsem schopen efektivněji filtrovat velkým množstvím nalezených textů, ale především si sám lépe uvědomím priority témat, což může být pomocnou rukou při tvorbě obsáhlejšího odborného textu.

Závěr

JSTOR je respektovaným zdrojem, který v mnoha ohledech předčí běžné odborné knihovny. Studenti zde naleznou zdroje vhodné pro seminární i diplomové práce a odborníci dostatek relevantních informací pro rozšiřování svých obzorů. Veřejnost zase ocení bezplatný přístup k značnému množství odborných článků z širokého spektra oborů. Hlavními přednostmi JSTORu jsou fulltextové vyhledávání a možnost detailního filtrování výsledků. JSTOR se díky všemu výše uvedenému vyvinul ve významný akademický informační zdroj, který jde začátečníkům naproti prostřednictvím uživatelské přívětivosti.

Ohledně využití pro competitive intelligence je překážkou, již dříve zmiňovaná, „pohyblivá zeď“, která posouvá zveřejnění většiny časopisů a e-knih o několik let. Proto není JSTOR vhodný pro vyhledávání nejnovějších událostí ve světě. JSTOR, si ale místo v CI stále najde, zejména v poskytování relevantních informací staršího data, které poslouží k vysvětlení dnešní situace nebo byly prvotním impulsem pro dlouhodobý trend.

Seznam zdrojů:

AUTOR, 2021a. Obrázek 1 Úvodní stránka [online]. Dostupné z: jstor.org

AUTOR, 2021b. Obrázek 2 Výsledek vyhledávání [online]. Dostupné z: https://www.jstor.org/action/doBasicSearch?Query=au%3A%28%22adam+smith%22%29&acc=on&wc=on&fc=off&group=none&refreqid=search%3A1ce16c88722c9a6c7be3480f0c8b1493

AUTOR, 2021c. Obrázek 3 Pokročilé vyhledávání [online] [vid. 2021-03-21]. Dostupné z: jstor.org

AUTOR, 2021d. Obrázek 4 Workspace [online]. Dostupné z: jstor.org

AUTOR, 2021e. Obrázek 5 Text analyzer [online]. Dostupné z: https://www.jstor.org/analyze/

JSTOR 1, nedatováno. Mission and history. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/mission-history/

JSTOR 2, nedatováno. Journals. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/librarians/journals/

JSTOR 3, nedatováno. Books. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/librarians/books/

JSTOR 4, nedatováno. Get JSTOR. About JSTOR [online]. [vid. 2021-03-20]. Dostupné z: https://about.jstor.org/get-jstor/

JSTOR 5, nedatováno. Searching: Boolean Operators. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115004733187-Searching-Boolean-Operators

JSTOR 6, nedatováno. Searching: Truncation, Wildcards and Proximity. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115012261448-Searching-Truncation-Wildcards-and-Proximity

JSTOR 7, nedatováno. Searching: Using Fields. JSTOR Support [online] [vid. 2021-03-22]. Dostupné z: https://support.jstor.org/hc/en-us/articles/115004732567-Searching-Using-Fields

KARLSHOCHSCHULE, 2017. How to Search JSTOR [online]. 18. červenec 2017. Dostupné z: https://karlshochschule.de/uploads/tx_txkhshelper/user_upload/How_to_Search_JSTOR.pdf

Loc.gov: Library of Congress

Autor:

Martin Havlík

-

2.7.2021

0

Tento článek pojednává o informačním zdroji, který umožňuje vyhledávat ve sbírkách největší světové knihovny a jejím digitalizovaném archivu a umožňuje vyhledávání a přístupu k dalším publikacím, které se nacházejí ve sbírkách spolupracujících institucí.

Informační zdroj Library of Congress

Knihovna Kongresu (Library of Congress) je největší knihovnou světa s více než 170 mil. kusů publikací ve sbírce (Library of Congress, 2021a) a s ročním růstem okolo 2 mil. publikací. Knihovna je Národní knihovnou USA. Slouží tak jako studovna a badatelna. Nachází se ve Washingtonu D.C. v několika hlavních budovách. Další pobočky má po celých Spojených státech a jiných státech světa. (Billington, 2021)

Tento informační zdroj slouží k přístupu ke službám knihovny (vyhledávání, objednávání služeb) a k přístupu k jejímu digitalizovanému obsahu. Obsah knihovny je přístupné zdarma. (Library of Congress, 2021b)

Vyhledávání v Library of Congress

Vyhledávání v katalogu knihovny probíhá několika způsoby. Nejednoduší je zadávání celého vyhledávaného výrazu do vyhledávací řádky. Tento dotaz ovšem bude široky a bude obsahovat také irrelevantní dotazy. Dotaz se dá filtrovat dle typu publikace. Vyhledávání lze vidět na obrázku č. 1.

Loc.gov: Library of Congress — Obrázek 1: Vyhledávání publikace. (Library of Congress, 2021c)

Vyhledávaný obsah se dá filtrovat, ale nastavování relevantní oblastí nelze nastavit na úrovni dotazů. Filtrování lze vidět na obrázku č. 2.

U elektronických a digitalizovaných dokumentů lze jejich obsah zobrazit přímo na monitoru u ostatních periodik dojde k přesměrování na katalog knihovny. U této možnosti (katalog knihovny) jsou rozšířené možnosti vyhledávání a k jejich popsání dojde níže.

Při zobrazení jsou uvedeny informace o publikaci. Jde např. o její název, vydavatele, autora, datum vydání, věcné poznámky k publikaci, či počet stran.

Základní vyhledávání

Ostatní vyhledávání je možné v online katalogu knihovny, ten je přístupný následovně na obrázku č. 3, popř. přes odkaz: https://catalog.loc.gov/.

Zde se přistupuje k vyhledávání následovně (modře základní, červeně pokročilý, zeleně klíčová slova) a lze to vidět na obrázku č. 4.

Všechny vyhledávání umožnují vyhledávat přes specifikované kategorie. Základní vyhledávání je umožněno přes následující kategorie, které jsou uvedeny níže a je dostupné přes odkaz https://catalog.loc.gov/vwebv/searchBrowse. Ukázku obrazovky pro základní vyhledávání lze vidět na obrázku č. 5.

Titles: Název publikace
Authors/creators: Autor, vydavatel publikace. Obsahuje dvojí způsob hledání:
- obsahuje zadaný řetězec
- začíná hledaným řetězcem
Subjects: Hledaná oblast publikace. Obsahuje dvojí způsob hledání:
- obsahuje zadaný řetězec
- začíná hledaným řetězcem
Names/titles: Hledaný výraz, jméno v textu. Obsahuje dvojí způsob hledání:
- obsahuje zadaný řetězec
- začíná hledaným řetězcem
Series/uniform titles: Hledaný název řady publikace
CALL NUMBERS: Umístění publikace
LCCN: Identifikátor publikace

V případech, kde vyhledáváme výskyt daného řetězce v textu, pak lze použít tyto zástupné symboly.

% – místo tohoto znaku může být jakýkoliv jeden znak,
? – místo tohoto znaku může být libovolné množství znaků.

Hledaný výraz lze také filtrovat dle:

Roku publikace,
řazení publikace do oblastí (dětské, evropské, americké apod.),
umístění publikace (v jaké knihovně se nachází),
typu publikace (kniha, film),
jazyku,
počtu záznamů na stránce.

Pokročilé vyhledávání

Další možností je pokročilé vyhledávání, které umožňuje spojovat jednotlivé zadané výrazy pomocí logických spojek. Vyhledávaní je přístupné zde: https://catalog.loc.gov/vwebv/searchAdvanced. Popis logických spojek je následující:

AND: Výsledek obsahuje oba zadané výrazy
OR: Výsledek obsahuje alespoň jeden zadaný výraz
NOT: Výsledek neobsahuje zadaný výraz

Vyhledávání probíhá pomocí podobných kategorií. Jejich počet je ovšem větší. Také zde funguje filtrování výsledků a zástupné symboly. Podobu pokročilého vyhledávání lze vidět na obrázku č. 6.

Vyhledávání dle klíčových slov

Poslední možností je vyhledávaní dle klíčových slov. Toto vyhledávání je přístupné zde: https://catalog.loc.gov/vwebv/searchKeyword.

Lze vyhledávat dle názvu, autora, oblasti, popř. si vybrat jakékoliv z definovaných kategorií (pod položkou EXPERT) na tomto seznamu: https://catalog.loc.gov/vwebv/ui/en_US/htdocs/help/index_name.html. U této kategorie lze také používat logické spojky. U všech kategorií funguje filtrování výsledků.

Ukázka vyhledávání v uložišti

Pro zkoušku vyhledáme publikace, která má v názvu Abraham Lincoln. Vyhledáváme tedy dle kategorie TITLE. První publikace se věnuje armádní kariéře Abrahama Lincolna. Je tedy relevantní k danému hledanému výrazu. To lze vidět na obrázku č. 7.

Po otevření se nám zobrazí informace o publikace. Je zde uveden autor publikace (včetně roků, kdy žil), název publikace, typ publikace, nakladatel a rok vydání. Dále je zde možnost o tuto knihu zažádat (ve fyzické podobě) a zjistit, kde se kniha nachází. To lze vidět na obrázku č. 8.

Mimo tyto informace jsou zde popsány informace o knize (počet stran, rozměry, materiál), ID v rámci knihovny, sekce, kde se publikace nachází a v jakých kategoriích je kniha řazena. Pro knihy, zde moc dodatečných informací není. Pro filmové publikace je jich ovšem více. Jsou zde např. uvedeni herci a všechny osoby spolupracující na filmu. Dále jsou zde i poznámky k obsahu filmu, co vše mimo film obsahuje (např. reklamy apod).

Autory publikací, popř. herce lze vyhledávat pomocí hyperlinkových odkazů, které přesměrují uživatele do vyhledávání dle dané kategorie. To lze např. vidět níže na obrázku č. 9.

Vyhledávání v kolekcích dokumentů

Knihovna umožňuje také vyhledávat v kolekcích dokumentů (např. soukromou korespondenci osob apod), popř. hledat jiné poskytovatele, kteří mají dokumenty, které se věnují dané oblasti, popř. obsahuje e-dokumenty (knihy, deníky). Ty jsou dostupné přes katalog knihovny na obrázku č. 10 (modře interní kolekce, zeleně externí kolekce a e-dokumenty).

V interních dokumentech se dá vyhledávat dle zadaného výrazu, popř. zobrazit všechny kolekce dle dané kategorie. Vyhledávání lze vidět na obrázku č. 11.

Při rozkliknutí výsledků se zobrazí informace o kolekci, kde se fyzicky nachází a co je jejím obsahem. Každý dokument je zde také popsaný.

Vyhledávání na externí kolekce probíhá výběrem oblasti, popř. zadáním do vyhledávání. Externí vyhledávání lze vidět na obrázku č. 12.

Zde se po rozkliknutí zobrazí seznam externích poskytovatelů dat, které mají o dané oblasti potřebné data. U každého je také popis, který vysvětluje, jaké informace se zde nacházejí a zda je přístupný zdarma, popř. za poplatek. To lze vidět na obrázku č. 13.

Po přepnutí na e-dokumenty se po rozkliknutí zobrazí informace o daném dokumentu, včetně informací, zda je přístupný a odkaz na externí stránky, kde je umístěn

Závěr

Informační zdroj loc.gov je přístupovým prostředí do sbírek Knihovny Kongresu. Z tohoto zdroje lze tak přistupovat k největším světovým sbírkám publikací o velikosti přesahující 170 mil. kusů. Umožňuje vyhledávat jak fyzické kusy, které si lze v knihovně zapůjčit, tak i v digitalizovaném archivu, včetně multimediálních záznamů. Mimo vlastní sbírky knihovny kongresu umožňuje vyhledávat také v dalších informačních zdrojích mimo vlastní sbírky knihovny.

V práci je popsán způsob práce s tímto informačním zdrojem z hlediska vyhledávání.

Zdroje

BILLINGTON, James H., 2021. Library of Congress. In britannica.com [online]. Chicago: Encyclopædia Britannica, Inc., 2021. [cit. 2021-03-23]. Dostupné z: https://www.britannica.com/topic/Library-of-Congress

LIBRARY OF CONGRESS, 2021a. General Information. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/about/general-information/

LIBRARY OF CONGRESS, 2021b. Frequently Asked Questions. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/about/frequently-asked-questions/

LIBRARY OF CONGRESS, 2021c. LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/

LIBRARY OF CONGRESS, 2021d. Search in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://www.loc.gov/search/?in=&q=&new=true&st=

LIBRARY OF CONGRESS, 2021e. Search option in LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/

LIBRARY OF CONGRESS, 2021f. Browse in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchBrowse

LIBRARY OF CONGRESS, 2021g. Advance search in archive of LIBRARY OF CONGRESS. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/searchAdvanced

LIBRARY OF CONGRESS, 2021h. abraham lincoln. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/search?searchArg=abraham+lincoln&searchCode=TKEY%5E*&searchType=1&limitTo=none&fromYear=&toYear=&limitTo=LOCA%3Dall&limitTo=PLAC%3Dall&limitTo=TYPE%3Dall&limitTo=LANG%3Dall&recCount=25

LIBRARY OF CONGRESS, 2021i. The military life of Abraham Lincoln, Commander in Chief. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/holdingsInfo?searchId=6212&recCount=25&recPointer=0&bibId=290817

LIBRARY OF CONGRESS, 2021j. Dupuy, Trevor N.. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://catalog.loc.gov/vwebv/search?searchArg=Dupuy,%20Trevor%20N.%20(Trevor%20Nevitt),%201916-1995.&searchCode=NAME%2B&searchType=1&recCount=25

LIBRARY OF CONGRESS, 2021k. Search Finding Aids. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://findingaids.loc.gov/

LIBRARY OF CONGRESS, 2021l. Library of Congress E-Resources Online Catalog. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://eresources.loc.gov/

LIBRARY OF CONGRESS, 2021m. Library of Congress E-Resources Online Catalog: Art and Architecture. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-03-23]. Dostupné z: https://eresources.loc.gov/search~S9/m?SEARCH=Art+and+Architecture

LIBRARY OF CONGRESS, 2021n. Úvodní snímek: George Washington. In loc.gov. [online]. Washignton D.C.: Library of Congress, 2021. [cit. 2021-05-02]. Dostupné z: https://www.loc.gov/resource/cph.3a09915

Nástroj Doing Business – analyzujte, kde jsou nejlepší podmínky pro podnikání

Autor:

Mechl Matyáš

-

12.3.2021

0

Základní informace o společnosti

Doing Business je projekt založen roku 2002, který zkoumáním několika metrik porovnává prostředí podnikové regulace v téměř 190 ekonomikách s cílem poskytnout akademickým pracovníkům, novinářům, zájemcům v oblasti ekonomiky a dalším informace o tom, který stát přináší nejpřijatelnější prostředí pro podnikání. Doing Business se nezaměřuje pouze na zkoumání podnikové regulace na úrovni států, ale provádí také studie různých měst a regionů ve vybraných zemích. Uživatel může porovnávat nejen státy světa, ale také některá jejich města. Lze tedy získat povědomí o tom, které město je z hlediska snadnosti podnikání optimální. Dalším záměrem tohoto projektu je vzbudit soutěživost jednotlivých ekonomik o vytvoření co nejadekvátnějších regulací. [1]

Indikátory

První zveřejněná studie Doing Business byla již rok po jeho založení, tedy v roce 2003. Studie zkoumala snadnost podnikání u 133 ekonomik pomocí 5 identifikátorů. Od této doby došlo k značnému pokroku, kdy letošní studie zahrnuje 190 ekonomik, které jsou měřeny pomocí 11 indikátorů. [1]

Seznam těchto indikátorů, včetně popisu, co je u nich měřeno obsahuje tabulka č.1., která je volně dostupná na stránkách Doing Business v sekci About.

Tabulka 1 Indikátory a co je u nich měřeno [2]

Indikátory	Co je měřeno
Starting a business	Postupy, čas, náklady, minimální kapitál pro založení s.r.o. pro muže a ženy
Dealing with construction permits	Postupy, čas a náklady na vyřízení všech formalit k vybudování skladu, mechanismy kontroly kvality a bezpečnosti v systému stavebního povolení
Getting electricity	Postupy, čas, náklady na připojení k elektrické síti, spolehlivost dodávky a transparentnost tarifů dodavatelů elektřiny
Registering property	Postupy, čas, náklady na převod nemovitostí. Kvalita systému katastrálního úřadu pro muže a ženy
Getting credit	Zákony o movitých věcech a úvěrové informační systémy
Protecting minority investors	Práva menšinových akcionářů v transakcích se spřízněnými stranami a ve správě a řízení společností
Paying taxes	Platby, čas a celková daň a sazba příspěvku, aby firma splňovala všechny daňové předpisy i procesy následné archivace
Trading across borders	Čas a náklady na export produktů s komparativní výhodou a na import zboží
Enforcing contracts	Čas a náklady na vyřešení obchodního sporu a kvalita soudních procesů pro muže a ženy
Resolving insolvency	Čas, náklady, výsledek a míra vymáhání obchodní neschopnosti a síla právního rámce pro platební neschopnost
Employing workers*	Flexibilita regulace zaměstnanosti
Contracting with the government*	Postupy, čas na účasti a získání veřejných zakázek. Regulační rámec spojený se zadáváním veřejných zakázek

* Nejsou součástí hodnocení v Doing Business 2020.

Získávání dat

Data, která společnost Doing Business využívá pro tvorby studií, jsou získávána ze 4 základních pramenů. Patří zde zákony a předpisy jednotlivých států, respondenti společnosti, vláda a zaměstnanci World Bank Group. Společnost uvádí, že má více než 48 tisíc profesionálů ve 190 ekonomikách. Kolekce dat následně probíhá pomocí písemné či ústní komunikace, dotazníkového šetření, vlastní návštěvou apod. [3] Celý proces, včetně časového harmonogramu se nachází na obrázku č.1.

Obrázek 1 Jak Doing Business sbírá a ověřuje data [4]

Využití

Doing Business představuje veřejně dostupný nástroj, jenž najde uplatnění v širokém spektru oblastí. Od roku 2003 bylo výzkumnými pracovníky napsáno tisíce článku opírající se o data, které poskytl tento nástroj. Dále kromě novinářů, lidí zajímající se o ekonomiku a mnoho dalších, je možno najít uplatnění i v oblasti zákonodárné, kdy poslanci/vláda mohou využít data pro objevení nedostatků země ve které působí a navrhovat efektivní zákony v oblasti podnikové regulace, které mohou vytvořit pro občany optimální prostředí pro podnikání a posunout ekonomiku země dopředu. [3]

První pohled na webové prostředí

Web společnosti Doing Business poskytuje uživatelům 7 jazykových mutací jako je angličtina, španělština, francouzština, portugalština, ruština, čínština a arabština. Při prvním pohledu na web uživatel hned vidí datový vyhledávač a přehled hlavních zjištění, kterých dosáhla společnost při tvorbě reportu „Doing Business 2020“. Za zmínku stojí například informace, že Saúdská Arábie, Jordánsko, Togo, Bahrajn, Tádžikistán, Pákistán, Kuvajt, Čína, Indie a Nigérie vykazují markantní zlepšení oproti minulých let. [5] Co se týče datového vyhledávače, jehož vzhled demonstruje obrázek č.2, ten nabízí uživateli možnost filtrace pomocí ekonomiky nebo indikátorů.

Obrázek 2 Datový vyhledávač na domovské obrazovce[5]

V případe filtrování podle ekonomiky (v tomto případě byla zvolena Česká republika) je uživatel přesměrován na záložku „Data“, kde mu jsou zobrazeny výsledky studie pro danou zemi. Uživatel se dozví, jaké celkové skóre země obdržela a na jaké pozici v celkovém žebříčku všech ekonomik se nachází.

Níže na stránce se nachází přehled, jak dopadlo hodnocení pro jednotlivé oblasti v rámci zvolené země. V případě České republiky může uživatel vidět, že ze všech zkoumaných ekonomik nabízí ČR nejlepší podmínky pro „Trading across Borders“. Na druhou stranu byla země nejhůř hodnocena v oblasti „Starting a Business“.

Obrázek 4 Výsledky pro jednotlivé oblasti [6]

Závěr přehledu tvoří interaktivní tabulka, kde se uživatel kliknutím na jednu z oblastní dozví, co vše bylo v rámci dané oblasti zkoumáno, včetně výsledků zkoumání. Vzhled tabulky pro oblast „Trading Across Boarders“ demonstuje obrázek níže.

Obrázek 5 Vzhled interaktivní tabulky [6]

V případě že by se uživateli o dané zemi chtěl dozvědět více než je zobrazeno na této stránce, je mu umožněno stáhnout si report v podobě PDF souboru, který obsahuje kompletní výsledky studie pro danou zemi včetně detailnějšího popisu jednotlivých oblastí. Pro zajímavost je vhodné zmínit, že v případě České republiky(odkaz) má report pro rok 2020 rozsah 69 stránek. Jestliže se nechce uživatel omezovat pouze na jeden stát a zajímají ho kompletní reporty studie “Doing Business” zahrnující všech 190 ekonomik, stačí pouze v navigační části webu přejí na stránku „Reports“, kde jsou pro uživatele připravené PDF reporty již od vydaní pro rok 2004. Volba reportu probíhá pomocí rozbalovacího seznamu.

Rankings

Další možnosti stránky doingbusiness.org přináší záložka „Rankings“, kde se nachází tabulka obsahující všech 190 ekonomik a jejich hodnocení. Uživatel si zde může vybrat zda chce vidět hodnocení v podobě rankingu nebo skóre. Obě dvě hodnoty reflektují úspěšnost ekonomiky v oblasti snadnosti podnikání, akorát na jinačí škále. V případě rankingu nabývá hodnocení hodnot od 1 do 190, kdy stát držící ranking 1 představuje ekonomiku poskytující nejpříznivější podmínky z hlediska regulací pro podnikání. Jedná se tedy o určitý žebříček. Jak již je ukázáno na obrázku č.3, celkové umístění ČR je na 41. místě, což muže být poněkud uspokojující. Pro zájemce zde Doing Business zanechává link na PDF soubor s názvem „ease of doing business rankings and the ease of doing business scores are calculated“, kde je možné na 10 stránkách se dočíst jak ranking a skóre fungují a jak jsou vypočítávány. [8]

Pro možnost filtrování dat v tabulce na stránce jsou zde připraveny dva rozbalovací seznamy. První rozbalovací seznam pojednává o regionech a druhý o platových třídách (viz. obrázky níže).

Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]

Výslednou tabulku lze také stáhnout ve formátu .xlsx či PDF. V případě nevyužití rozbalovacího seznamu se na stránce nachází tabulka obsahujících všech 190 záznamů. Například z přiloženého obrázku č.8 lze vyčíst, že nejpřijatelnější prostředí pro podníkání z pohledu státní regulací je Nový Zéland.

Obrázek 8 Nejlépe hodnocené ekonomiky [8]

Historical Data Sets and Trends Data

Záložka „Historical Data Sets and Trends Data“ umožňuje uživateli vygenerovat si dataset na základě jeho preferencí z dat, které Doing Business má. Tvorba zde probíhá ve 3 krocích, kdy v prvním si uživatel vybere ekonomiky, které chce v datasetu mít. Uživatel si může vyklikat jednotlivé ekonomiky nebo využít předdefinovaných skupin tvořených buď podle regionů, nebo platových skupin.

Obrázek 9 Vzhled filtru pro vytváření datasetu [9]

V kroku č.2 dochází k volbě oblastí – Starting a Business, Getting Credit, Trading across Borders apod. Poslední krok nabízí možnost zvolit si zda bude dataset obsahovat data pouze z Doing Business 2020, či i starší. Výsledek se na stránce zobrazí ve formě interaktivní tabulky s možnosti stažení ve formátu .xlsx či pdf.

Law Library

Záložka s názvem „Law Library“ se představuje jako největší online sbírka obchodních zákonů a předpisů. [10] Jedná se o velice povedený nástroj, kdy pomocí filtrů je uživatel schopen si vyhledat zákony a předpisy ve 190 ekonomikách. Na výběr je zde od administrativních až po daňové zákony. Výsledek se zobrazí ve formě url linku odkazujících na relevantní zdroj. V případě bankovního práva České republiky se jedná o webové stránky ČNB.

Obrázek 10 Bankovní a daňové zákony pro ČR [10]

Business Reforms

Poslední zajímavý nastroj přináší záložka s názvem „Business Reforms“, kde pomocí selekce ekonomiky, oblasti či regionu se uživatel může dozvědět, jaké se v dané lokalitě vytvořily reformy pro ulehčení či ztížení podnikaní. V případě, pro tuto práci zvolené, České republiky se zde vyskytuje poslední záznam z roku 2018, kde ČR provedla zlepšení v oblasti „Starting Business“ a to snížením poplatků pro založení společnosti s ručeným omezeným. Naopak ke ztížení podnikaní došlo v oblasti placení daní, kde zavedením nových požadavků na vyplnění přiznání k DPH došlo ke zkomplikování procesu placení daní. [11]

Závěr

Doing Businnes představuje projekt založený v roce 2002, který provádí studie v celkem 190 ekonomikách napříč světem. Cílem projektu je zmapovat oblast podnikové regulace v jednotlivých ekonomikách a určit, který stát přináší nejpřijatelnější prostředí pro podnikání. Výsledky jejich studie následně publikují na svých stránkách s názvem “Doing Business”, kde jsou volně ke stažení v PDF formátu. Mimo toho se na stránkách společnosti nachází cela řada užitečných nástrojů. Za zmínku stojí třeba možnost stažení si datasetu Doing Business, nahlédnout do největší online sbírky obchodních zákonů a mnoho dalších. Autor doporučuje všem čtenářům si webovou stránku společnosti Doing Business prohlédnout, jelikož se jedná o velice zajímavý a přínosný projekt nacházející uplatnění v mnoha oblastech od novinařiny až po politiku.

Zdroje

[1] About us. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/about-us

[2] What Doing Business measures—12 areas of business regulation. In: About Doing Business: Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[3] About Doing Business. Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[4] How Doing Business collects and verifies the data. In: About Doing Business: Openknowledge.worldbank.org [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://openknowledge.worldbank.org/bitstream/handle/10986/32436/9781464814402_Ch01.pdf

[5] DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/doingbusiness

[6] Ease of Doing Business in Czech Republic. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/data/exploreeconomies/czech-republic#DB_tab

[7] Reports. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/reports/global-reports/doing-business-2020

[8] Rankings. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/rankings

[9] Historical Data Sets and Trends Data. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/custom-query

[10] Law Library. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/law-library

[11] Business Reforms in Czech Republic. DoingBusiness Measuring Business Regulations [online]. The World Bank Group, c2021 [cit. 2021-02-05]. Dostupné z: https://www.doingbusiness.org/en/reforms/overview/economy/czech-republic

Seznam obrázků

Obrázek 1 Jak Doing Business sbírá a ověřuje data [4]

Obrázek 2 Datový vyhledávač na domovské obrazovce [5]

Obrázek 3 Hodnocení České republiky [6]

Obrázek 4 Výsledky pro jednotlivé oblasti [6]

Obrázek 5 Vzhled interaktivní tabulky [6]

Obrázek 6 Rozbalovací seznam [7]

Obrázek 7 Rozbalovací seznamy pro regiony a platové třídy [8]

Obrázek 8 Nejlépe hodnocené ekonomiky [8]

Obrázek 9 Vzhled filtru pro vytváření datasetu [9]

Obrázek 10 Bankovní a daňové zákony pro ČR [10]

Obrázek 11 Business reformy pro ČR [11]

CC Search – k stovkám milionů fotografií z celého světa

Autor:

Jan

-

11.3.2021

0

Co znamená Creative Commons Search?

Zkratka CC reprezentuje název neziskové organizace Creative Commons, která se zabývá licencováním multimediálního obsahu. Zároveň do jejího portfolia spadá již zmíněný CC Search, což je nástroj, který umožňuje snadno objevovat a používat otevřeně licencovaná a veřejně dostupná autorská díla pomocí snadného vyhledávání. CC Search prohledává více než 300 milionů obrázků z otevřených API a datové sady Common Crawl. Jde nad rámec jednoduchého vyhledávání a agreguje výsledky napříč několika veřejnými úložišti (Flickr, Europeana,… ) do jednoho souhrnného katalogu. V současné době CC Search plně podporuje prohledávání obrázků, ale plánují plně implementovat vyhledávání napříč dalšími typy médií, jako jsou otevřené texty, audio a video. Tento “další” multimediální obsah momentálně běží v testovací verzi. Obsah z těchto platforem lze prohledávat pomocí CC Search a sdílet na webu díky licencím CC.

Ukázka procházených zdrojů — Obrázek: Ukázka log procházených informačních zdrojů s licencovaným obsahem dle CC. [Zdroj: creativecommons.org]

Typy licencí Creative Commons

Každé dílo, ať už jde o obrázek, fotografii, hudbu, odborný i prozaický, nebo i poetický text, má svého autora a ten vlastní k dílu autorská práva. Ta obsahují mix práv a povinností spjatých s daným dílem a stanovují to, jak se s ním smí zacházet. Autorskoprávní nástroje a licence Creative Commons vytvářejí rovnováhu v rámci tradičního nastavení “všechna práva vyhrazena”, které jinak automaticky autorské právo zajišťuje. Nástroje Creative Commons nabízejí každému, od jednotlivých autorů až po velké společnosti jednoduchý standardizovaný způsob, jak umožnit ostatním užívat jejich dílo. Přehled jednotlivých licencí s ukázkou práv a povinností k nim spjatých je uveden v následující tabulce.

Tabulka znázorňující přehled licencí a práv + povinností — Tabulka: Znázorňující přehled CC licencí a jejich práv + povinností [Zdroj: web.natur.cuni.cz]

Možnosti vyhledávání v CC Search

Na první pohled při příchodu na platformu CC Search, která se nachází na adrese https://search.creativecommons.org se uživateli objeví nápadně podobné rozhraní připomínající jinou vyhledávací platformu Google. Uprostřed obrazovky se tyčí velký Search Bar umožňující zadání klíčových slov pro vyhledávání v rámci obsahu, který je licencovaný pomocí CC licencí. Po kliknutí na tlačítko Search se uživateli zobrazí, stejně jako u Googlu katalog výsledků, které se vztahují ke klíčovým slovům, jenž uživatel zadal k vyhledání.

CCSearch Úvodní stránka — Obrázek: Úvodní stránka při příchodu na search.creativecommons.org [Zdroj: Vlastní zpracování]

Syntaxe vyhledávání

Stejně jako již zmíněný Google, tak i CC Search umožňuje uživatelům konkretizovat jejich vyhledávání pomocí speciálních symbolů nebo slov, které slouží k bližšímu upřesnění vámi hledaných spojení.

Vyhledávání s přesnou shodou

Pro vyhledávání slova nebo fráze je nutné hledaný termín dát do uvozovek. Například pro doslovné vyhledávání tvrzení Empire State building je potřeba do Search Baru zadat “Empire State Building”, tím dáváme najevo, že nás zajímá jen přesná shoda, nikoliv částečná.

Kombinování vyhledávaných termínů

Pokud by uživatel potřeboval různě kombinovat vyhledávané termíny, tak k tomu slouží operátory, které umožňují vykonávat komplexnější dotazy. Nejprve budou představeny samotné operátory a poté ke každému bude uveden příklad využití a vysvětlení jak funguje.

+ Operátor značící logickou operaci AND
| Operátor značící logickou operaci OR
– Operátor negující jeden token/termín
* Operátor, který na konci hledaného výrazu značí tzv. prefix query
() Operátor pro signalizaci priority
~N Operátor uvádějící se na konci slova sloužící k nastavení Fuzzy distance výrazu

Příklady vyhledávání:

dog+cat -> Tento dotaz vyhledá výsledky, na kterých je jak pes, tak kočka.

dog|cat -> Tento dotaz by vyhledal výsledky, na kterých je buď pec nebo kočka, ale nemusely by tam nutně být oba.

dog -buldog -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale vynechal by ty na nich je vyobrazený buldok. Využili jsme daný operátor – k vyloučení buldočího plemene z výsledků vyhledávání psů.

net* -> Tento dotaz by vyhledal výsledky pro slova, které začínají na net a hvězdička poté značí, že může následovat cokoliv. Jedná se o takzvaný Wildcard operátor. Takže ve výsledcích by se mohla objevit slova jako: Netflix, Netherlends, network, a spousta dalších.

dogs + (labrador|chivava) -> Tento dotaz by vyhledal výsledky, na kterých jsou psi, ale konkrétně čivava nebo labrador. Závorky slouží k určení priority dotazu nebo ke kombinování složitějších dotazů.

theatre~1 -> Tento dotaz by vyhledal výsledky, které se mohou lišit o proti hledanému výrazu o jeden znak. Výsledek by tedy mohl obsahovat slova, která mají jiný pravopis jako třeba Theater místo Theatre. Tento jev se odborně nazývá fuzzy logic/fuzziness.

CC Search - k stovkám milionů fotografií z celého světa — Vyhledávání přesného výrazu

Meta Search

Meta vyhledávač (známý také jako více vláknový modul) je vyhledávací nástroj, který odesílá váš dotaz současně několika vyhledávačům (Search Engine), webovým adresářům (WD) a někdy i takzvanému Invisible (Deep) Webu, shromažďování online informací neindexovaných tradičními vyhledávači. V tomto případě se vyhledávač snaží najít veškery obsah indexovaný licencemi Creative Commons. CC Search následně z posbíraných pozitivních výsledků hledání vytvoří katalog, který se uživateli zobrazí jako výsledek hledání, ale tato funkcionalita zatím funguje pouze pro obrázky. Audio a Video má na stránce zastoupení v záložkách, ale hledání momentálně nabízí jen odkazy na zdroje obsahující daný obsah pod licencemi CC, což je názorně předvedeno v přiložených obrázcích.

Filtrování a přehled výsledků

Výsledný agregovaný katalog obrázků pro audio a video tato funkcionalita zatím nefugnuje, lze dále selektovat finální výběr obrázků, na základě intuitivních filtrů, které CC Search nabízí v levém menu. K dispozici jsou uživateli filtry podle:

Použití obrázku
Typu CC licence obrázku
Zdroje obrázku
Typu obrázku
Formátu obrázku
Poměru stran
Velikosti obrázku
Autora

Filtry fungují velmi intuitivně jako na většině eshopů a běžných stránkách, kdy uživatel vybere jednotlivé filtry, o které má zájem a ty mu automaticky překreslují výsledný katalog, aby splňoval uživatelem stanovené požadavky. Pokud by si přál odstranit nějaký konkrétní filtr, tak jej stačí odkliknout nebo zrušit křížkem, případně je zde možnost vyčistit všechny filtry, která zruší veškeré nastavené filtrování výsledků.

Zdroje:

Anopress: Inteligentní monitoring médií

Autor:

Šárka Plachá

-

10.3.2021

0

Úvod

Informace nás dnes zahlcují ze všech stran, ať už z tisku, rozhlasu, internetu anebo sociálních sítí. Díky neustálému růstu a rychlosti médií, je tak velmi obtížně držet krok s dobou.

Jaké jsou nejnovější články na téma, které vás zajímá? Kolikrát se letos psalo o vaší firmě v médiích a kolikrát o konkurentech? Čemu se média nyní věnuji? Místo trávení velkého množství času s vyhledávači ve snaze najít odpovědi na tyto otázky, máme nyní možnost využít informační zdroje, které nám s těmito problémy snadno pomohou.

Anopress: Inteligentní monitoring médií — Základní rozhraní systému Anopress. [Zdroj: autor]

Obecné informace o databázi Anopress

Anopress představuje databázi českých médii, která mimo plných textů z českých noviny a časopiseckých článků, obsahuje doslovné přepisy televizních a rozhlasových relací, nebo například zprávy z internetových serverů. V roce 2019 byla databáze také rozšířena o sociální média, konkrétně Facebook, Instagram, Twitter, Youtube a archivně tištěných publikací sahá až do roku 1996 a obsahuje i tituly které již dávno nevychází. U televizních a rozhlasových relací je archiv datován do roku 1998. V současné době je monitorováno 5183 zdrojů z České republiky a Slovenska.

K aktualizaci článků dochází u většiny typů médií (televize, rozhlas, internet, sociální média) v průběhu celého dne, denní tisk je aktualizován každý den v 6 hodin ráno. Denně do databáze přibývá zhruba 300 tisíc nových záznamů (https://www.anopress.cz, 2021 a Masarykova univerzita, 2020)

Databázi spravuje od roku 2020 společnost NEWTON Media, a. s. , která v České republice působí od roku 1995. Společnost Anopress IT, a.s, která databázi založila, zanikla fúzí se společností NEWTON Media k 31. 12. 2019. (Wikipedie: Otevřená encyklopedie, 2020; https://www.mediar.cz/anopress-splyne-s-materskou-firmou-newton-media/, 2. 12. 2019)

Vyhledávání

Výběr období – Tento filtr nám umožňuje omezit období, kdy byly dané články vydané či zpracované. A to od hodiny až po dny, týdny, měsíce anebo roky.Pro základní vyhledávání sloučí vyhledávací pole, jež se nachází v horní části úvodní obrazovky. Dotaz může tvořit jedno slovo nebo více slov za sebou, v druhém případě pak výsledkem budou články, které obsahují celé toto sousloví. Veškeré hledané výrazy se automaticky skloňují, vyhledavač pak nebere v potaz velikost písmen, avšak je nutné zadávat českou diakritiku. Anopress pak také nabízí mnoho dalších kritérií, které při vyhledávání můžete využít. Tyto kritéria se nachází pod vyhledávacím oknem. Mezi tyto kritéria patří:

Výběr zdrojů – Tato funkce nám umožňuje vybrat supinu zdrojů, čí přímo pouze konkrétní zdroj, popřípadě negace dané skupiny nebo zdroje. Uživatel si pak může vybrat z osmi skupin zdrojů Celostátní, TV a rozhlas, Regiony, Časopisy a ostatní, Internet, Webmonitoring, Sociální média, Webmonitoring – sk.
Rozšířené vyhledávání – Tato možnost nám nabízí rozšířit naše konkrétní vyhledávání o konkrétního autora, stranu, název, rubriku anebo relaci. Tyto kritéria lze také negovat a mezi kritérii lze nastavit vztah „a zároveň“ či „nebo“.
Výběr operátorů – V této nabídce máme několik operátorů, které se vkládají po kliknutí do vyhledávacího pole a umožňují nám tak rozšířit či konkretizovat vyhledávané slova. Operátory lze zadávat i ručně a to buď velkými či malými písmeny. Mezi operátory najdeme:
- AND – tento operátor představuje slovní spojení „a zároveň“. Výsledky tak budou obsahovat obě klíčová slova spojené tímto operátorem.
- OR – zastupuje slovní spojení „nebo“ a výsledkem tak budou články, které obsahují alespoň jedno klíčového slovo spojení tímto operátorem. Tento operátor lze také nahradit čárkou.
- NOT – umožňuje vyloučit konkrétní klíčová slova, která zadáme.
- .BEST – operátor odpovídá již předešlému operátoru OR, ale oproti němu přiřazuje výsledkům s oběma slovy vyšší váhu, než výsledkům, které obsahují pouze jedno klíčové slovo. Pod tímto operátorem si zhruba můžeme představi slovní spojení „nejlépe s“.
- .NEAR – při použití tohoto operátoru bude vyhledávač vyhledávat články s oběma klíčovými slovy spojené tímto operátorem a budou seřazené dle relevance. Nejvýše budou články, kde jsou tato slova nejblíže. Můžeme také nastavit maximální vzdálenost slov. V takovém případě bude mít operátor například tvar „.near/16“. Přičemž číslo šestnáct představuje maximální vzdálenost. Doporučuje se používat čísla 16, což je průměrná délka české věty, a 66, což je průměrná délka českého odstavce.
- .COUNT – pomocí tohoto operátoru můžeme určit, minimálně kolikrát by se dané slovo mělo ve výsledku objevit. Řekněme, že chceme, aby se slovo výsledku objevilo minimálně pětkrát. V takovém případě bude mít operátor tvar .count/5 a výsledkem budou články, jenž obsahují alespoň pět daných klíčových slov v jakém kolik slovním tvaru.

Důležité je ještě zmínit, že operátory .BEST, .NEAR a .COUNT je nutné použít s tečkou, aby byly využity jako operátor. Ačkoli se před operátory AND, OR, NOT tečka psát nemusí, vyhledávač s nimi dokáže pracovat i pokud budou tečku obsahovat.

Mimo těchto možností pak vyhledávací řádka dokáže pracovat s dalšími operátory, které nejsou v nabídce uvedeny. Jednak se konkrétně o tyto operátory:

.WORD – zabraňuje skloňování daného slova a vyhledává jen přesně zadaný tvar. Tento operátor pak lze nahradit uvozovkami.
.CASE – tento operátor pak zachovává uvedenou velikost písmen.

Při vyhledávání můžeme pro složitější výrazy použít kulaté závorky. Je si však potřeba dát pozor na počet levých a pravých závorek, který musí odpovídat. Dále je třeba upozornit na to, že nová slova cizího původu, což jsou většinou jména a názvy firem, se automaticky neskloňují. V takovém případě je dobré buďto uvést všechny možné tvary nebo použít operátor „*“, který nahrazuje jakákoliv písmena. Například tak při vyhledávání slova Anopress* máme jistotu, že ve výsledku budou i slova Anopressem, Anopressu apod.

Použitý vyhledávací dotaz je možné si uložit i pro budoucí použití a to pomocí tlačítka „Dotazy“ vlevo.

Novinkou, s kterou Anopress přišel v roce 2019, je vyhledávání pomocí emotikonů. (Mav, 2019)

Práce s výsledky

Kliknutím na název článku se nám zobrazí plnotextový přepis článku. Ten si dále můžeme zobrazit jako náhled originálu anebo rovnou přejít na originální stránku, pokud to je možné. Publikaci si dále můžeme uložit do vlastní schránky, stáhnout (do formátů HTML, PDF, RTF, TXT anebo CSV), poslat mailem, vytisknout anebo vygenerovat pevný odkaz na daný článek. Novější funkcí je možnost citace ve spolupráci se stránkou citace PRO.Výsledné články můžeme pomocí tlačítka vlevo pod vyhledávací konzolí seřadit od nejnovějších, dle data vydání, dle relevance, dle titulku anebo dle strany, pořadí. Vpravo pak máme možnost zapnout Anotace, díky kterým i jednotlivých článků uvidíme grafický náhled. Další možností je pak tlačítko graf, které nám zobrazí grafické zpracování článku dle data a typu, tedy zda šlo o tisk, internet, sociální média, televizi anebo rozhlas. Tento graf si následně můžeme pomocí tlačítka vpravo vyexportovat jako obrázek, pdf nebo excel.

Pro nás pak velmi podstatným číslem je procento, které se výsledcích objevuje pod každým článkem. Toto procento nám ukazuje, jak moc článek odpovídá našemu vyhledávání.

Další funkce

Jednou z dalších funkcí, kterou Anopress nabízí je možno zasílání tak zvaných alertů v případě vydaní nového článku, jež odpovídá našemu dotazu. U alertu můžeme nastavit výstup, konkrétně název, formát, kódování, vzhled, obsah, zda má klíčová slova zvýraznit a zda má články dle něčeho seskupit či jak je seřadit. Dále je možné nastavit časování, tedy zda chceme upozornění dostávat denně, týdně, měsíčně, jako konkrétní den a jaký čas. V neposlední řadě je nutné vyplnit naši emailovou adresu a potvrdit vytvoření tohoto plánu.

V pravém horním rohu si pak můžeme prohlédnout statistiky stažení anebo dashboard, který obecně zobrazuje denní statistiky nových článků. Tento dashboard je však možné si personalizovat a nastavit co se na něm má zobrazovat. Následně si dashboard můžeme nastavit jako uvítací obrazovku, když do aplikace přijdeme.

Jak Anopress ukládá publikace do databáze

Tento proces se liší dle typu publikace, tedy zda jde o tisk, televizní záznam, rozhlas anebo sociální síť.

V případě tisku je buď článek zaslán v elektronické podobě, což je nejjednodušší možnost. Článek se pak sváže s náhledem, zdrojem, opatří se potřebnými metadaty a následně se nahraje do databáze. Pokud článek přijde v grafické podobě, například přední strana novin, je použit speciální software, který identifikuje článek a přepíše jej do textové podoby. Následně je nahrán do databáze.

Co se týče televizních a rozhlasových záznamů, dříve veškeré zpracování probíhalo ručně, nyní je již většinou automatizované a ručně je pak prováděna editace. K veškerým publikacím tohoto typu tak existuje jak textový přepis, tak odkaz na nahrávku. Důležitou činností je pak zde také identifikace mluvčího.

U webmonitoringu se dříve využívali RSS kanály, dnes však Anopress využívá crawlery. Sociální sítě jsou také automaticky nahrávané, ovšem stojí za zmínku, že jsou pozorované jen veřejné profily.

Licence

Společnost NEWTON Media nabízí dva druhy ročních licencí přístupu do databáze Anopress pro instituce s jedním uživatelským přístupem. Přístup je dostupný nepřetržité a váže se k heslu a IP adrese. S možností přihlašování odkazem, kdy pak není potřeba heslo. Tento přístup využívá většina knihoven a škol, které chtějí zpřístupnit databázi svým uživatelům.

První z nich je přístup s pouze možností prohlédnout si články, které jsou jeden rok staré. V tom případě je cena na rok 1 000 Kč bez DPH. Druhá licence je pak plnohodnotná, tedy s možností prohledávat všechny články až do roku 1996. Cena této licence činí 2 750 Kč bez DPH (dle informací k roku 2019). (Veřejné informační služby knihoven, 2020)

Příklady využití

Databáze Anopress skýtá mnoho možností využití. Jednak k hledání vydaných publikací o vlastní firmě, produktech nebo například o konkurenci. Zjištění informací o oboru, ve kterém člověk působí a hlavně nových inovací v daném odvětví. Možné nové příležitosti a trhu, či obecně informace o aktuálním dění. Nebo například hledání informací o konkrétních osobách jako jsou obchodní partneři, politici, či jiné známe osobnosti.

Databáze je pak častým zdrojem pro studenty při psaní jejich závěrečných prací. To hlavně díky tomu, že společnost spolupracuje s několika vysokými školami, a tak studenti těchto škol mají k databázi Anopress volný přístup. Mezi tyto školy patří například Vysoká škola Ekonomická v Praze, Masarykova univerzita nebo Univerzita Karlova. (Anopress, 2020)

Společnost Anopress pak také od konce roku 2019 zahájila spolupráci se společností EBSCO Information Services a tak nově EBSCO Discovery Service™ indexuje i databázi Anopress. Plný text se však zobrazí jen v případě, že má daný uživatel do databáze Anopress přístup. (EBSCO Information Services, 2019)

Zdroje

EBSCO Information Services. EBSCO Discovery Service nově indexuje databázi Anopress [online]. 17. 12. 2019 [cit. 07. 02. 2021]. Dostupné z: https://www.ebsco.com/e/cs-cz/blog/novinky-ebsco-discovery-prosinec

MAV. Anopress monitoruje postoje, emoce a nálady. In: Mediaguru.cz [online]. 2019 [cit. 05. 02. 2021]. Dostupné z: https://www.mediaguru.cz/clanky/2019/06/anopress-monitoruje-postoje-emoce-a-nalady/