Úterý, 8 července, 2025
Domů Blog Stránka 20

Anopress: Inteligentní monitoring médií

0
social-media

Úvod

Informace nás dnes zahlcují ze všech stran, ať už z tisku, rozhlasu, internetu anebo sociálních sítí. Díky neustálému růstu a rychlosti médií, je tak velmi obtížně držet krok s dobou.

Jaké jsou nejnovější články na téma, které vás zajímá? Kolikrát se letos psalo o vaší firmě v médiích a kolikrát o konkurentech? Čemu se média nyní věnuji? Místo trávení velkého množství času s vyhledávači ve snaze najít odpovědi na tyto otázky, máme nyní možnost využít informační zdroje, které nám s těmito problémy snadno pomohou.

 Základní rozhraní systému Anopress. [Zdroj: autor]

Obecné informace o databázi Anopress

Anopress představuje databázi českých médii, která mimo plných textů z českých noviny a časopiseckých článků, obsahuje doslovné přepisy televizních a rozhlasových relací, nebo například zprávy z internetových serverů. V roce 2019 byla databáze také rozšířena o sociální média, konkrétně Facebook, Instagram, Twitter, Youtube a archivně tištěných publikací sahá až do roku 1996 a obsahuje i tituly které již dávno nevychází. U televizních a rozhlasových relací je archiv datován do roku 1998. V současné době je monitorováno 5183 zdrojů z České republiky a Slovenska.

K aktualizaci článků dochází u většiny typů médií (televize, rozhlas, internet, sociální média) v průběhu celého dne, denní tisk je aktualizován každý den v 6 hodin ráno. Denně do databáze přibývá zhruba 300 tisíc nových záznamů (https://www.anopress.cz, 2021 a Masarykova univerzita, 2020)

Databázi spravuje od roku 2020 společnost NEWTON Media, a. s. , která v České republice působí od roku 1995. Společnost Anopress IT, a.s, která databázi založila, zanikla fúzí se společností NEWTON Media k 31. 12. 2019. (Wikipedie: Otevřená encyklopedie, 2020; https://www.mediar.cz/anopress-splyne-s-materskou-firmou-newton-media/, 2. 12. 2019)

Vyhledávání


Výběr období 
– Tento filtr nám umožňuje omezit období, kdy byly dané články vydané či zpracované. A to od hodiny až po dny, týdny, měsíce anebo roky.Pro základní vyhledávání sloučí vyhledávací pole, jež se nachází v horní části úvodní obrazovky. Dotaz může tvořit jedno slovo nebo více slov za sebou, v druhém případě pak výsledkem budou články, které obsahují celé toto sousloví. Veškeré hledané výrazy se automaticky skloňují, vyhledavač pak nebere v potaz velikost písmen, avšak je nutné zadávat českou diakritiku. Anopress pak také nabízí mnoho dalších kritérií, které při vyhledávání můžete využít. Tyto kritéria se nachází pod vyhledávacím oknem. Mezi tyto kritéria patří:

  • Výběr zdrojů – Tato funkce nám umožňuje vybrat supinu zdrojů, čí přímo pouze konkrétní zdroj, popřípadě negace dané skupiny nebo zdroje. Uživatel si pak může vybrat z osmi skupin zdrojů Celostátní, TV a rozhlas, Regiony, Časopisy a ostatní, Internet, Webmonitoring, Sociální média, Webmonitoring – sk.
  • Rozšířené vyhledávání – Tato možnost nám nabízí rozšířit naše konkrétní vyhledávání o konkrétního autora, stranu, název, rubriku anebo relaci. Tyto kritéria lze také negovat a mezi kritérii lze nastavit vztah „a zároveň“ či „nebo“.
  • Výběr operátorů – V této nabídce máme několik operátorů, které se vkládají po kliknutí do vyhledávacího pole a umožňují nám tak rozšířit či konkretizovat vyhledávané slova. Operátory lze zadávat i ručně a to buď velkými či malými písmeny. Mezi operátory najdeme:
    • AND – tento operátor představuje slovní spojení „a zároveň“. Výsledky tak budou obsahovat obě klíčová slova spojené tímto operátorem.
    • OR – zastupuje slovní spojení „nebo“ a výsledkem tak budou články, které obsahují alespoň jedno klíčového slovo spojení tímto operátorem. Tento operátor lze také nahradit čárkou.
    • NOT – umožňuje vyloučit konkrétní klíčová slova, která zadáme.
    • .BEST – operátor odpovídá již předešlému operátoru OR, ale oproti němu přiřazuje výsledkům s oběma slovy vyšší váhu, než výsledkům, které obsahují pouze jedno klíčové slovo. Pod tímto operátorem si zhruba můžeme představi slovní spojení „nejlépe s“.
    • .NEAR – při použití tohoto operátoru bude vyhledávač vyhledávat články s oběma klíčovými slovy spojené tímto operátorem a budou seřazené dle relevance. Nejvýše budou články, kde jsou tato slova nejblíže. Můžeme také nastavit maximální vzdálenost slov. V takovém případě bude mít operátor například tvar „.near/16“. Přičemž číslo šestnáct představuje maximální vzdálenost. Doporučuje se používat čísla 16, což je průměrná délka české věty, a 66, což je průměrná délka českého odstavce.
    • .COUNT – pomocí tohoto operátoru můžeme určit, minimálně kolikrát by se dané slovo mělo ve výsledku objevit. Řekněme, že chceme, aby se slovo výsledku objevilo minimálně pětkrát. V takovém případě bude mít operátor tvar .count/5 a výsledkem budou články, jenž obsahují alespoň pět daných klíčových slov v jakém kolik slovním tvaru.

Důležité je ještě zmínit, že operátory .BEST, .NEAR a .COUNT je nutné použít s tečkou, aby byly využity jako operátor. Ačkoli se před operátory AND, OR, NOT tečka psát nemusí, vyhledávač s nimi dokáže pracovat i pokud budou tečku obsahovat.

Mimo těchto možností pak vyhledávací řádka dokáže pracovat s dalšími operátory, které nejsou v nabídce uvedeny. Jednak se konkrétně o tyto operátory:

  • .WORD – zabraňuje skloňování daného slova a vyhledává jen přesně zadaný tvar. Tento operátor pak lze nahradit uvozovkami.
  • .CASE – tento operátor pak zachovává uvedenou velikost písmen.

Při vyhledávání můžeme pro složitější výrazy použít kulaté závorky. Je si však potřeba dát pozor na počet levých a pravých závorek, který musí odpovídat. Dále je třeba upozornit na to, že nová slova cizího původu, což jsou většinou jména a názvy firem, se automaticky neskloňují. V takovém případě je dobré buďto uvést všechny možné tvary nebo použít operátor „*“, který nahrazuje jakákoliv písmena. Například tak při vyhledávání slova Anopress* máme jistotu, že ve výsledku budou i slova Anopressem, Anopressu apod.

Použitý vyhledávací dotaz je možné si uložit i pro budoucí použití a to pomocí tlačítka „Dotazy“ vlevo.

Novinkou, s kterou Anopress přišel v roce 2019, je vyhledávání pomocí emotikonů. (Mav, 2019)

Práce s výsledky


Kliknutím na název článku se nám zobrazí plnotextový přepis článku. Ten si dále můžeme zobrazit jako náhled originálu anebo rovnou přejít na originální stránku, pokud to je možné. Publikaci si dále můžeme uložit do vlastní schránky, stáhnout (do formátů HTML, PDF, RTF, TXT anebo CSV), poslat mailem, vytisknout anebo vygenerovat pevný odkaz na daný článek. Novější funkcí je možnost citace ve spolupráci se stránkou citace PRO.Výsledné články můžeme pomocí tlačítka vlevo pod vyhledávací konzolí seřadit od nejnovějších, dle data vydání, dle relevance, dle titulku anebo dle strany, pořadí. Vpravo pak máme možnost zapnout Anotace, díky kterým i jednotlivých článků uvidíme grafický náhled. Další možností je pak tlačítko graf, které nám zobrazí grafické zpracování článku dle data a typu, tedy zda šlo o tisk, internet, sociální média, televizi anebo rozhlas. Tento graf si následně můžeme pomocí tlačítka vpravo vyexportovat jako obrázek, pdf nebo excel.

Pro nás pak velmi podstatným číslem je procento, které se výsledcích objevuje pod každým článkem. Toto procento nám ukazuje, jak moc článek odpovídá našemu vyhledávání.

Další funkce

Jednou z dalších funkcí, kterou Anopress nabízí je možno zasílání tak zvaných alertů v případě vydaní nového článku, jež odpovídá našemu dotazu. U alertu můžeme nastavit výstup, konkrétně název, formát, kódování, vzhled, obsah, zda má klíčová slova zvýraznit a zda má články dle něčeho seskupit či jak je seřadit. Dále je možné nastavit časování, tedy zda chceme upozornění dostávat denně, týdně, měsíčně, jako konkrétní den a jaký čas. V neposlední řadě je nutné vyplnit naši emailovou adresu a potvrdit vytvoření tohoto plánu.

V pravém horním rohu si pak můžeme prohlédnout statistiky stažení anebo dashboard, který obecně zobrazuje denní statistiky nových článků. Tento dashboard je však možné si personalizovat a nastavit co se na něm má zobrazovat. Následně si dashboard můžeme nastavit jako uvítací obrazovku, když do aplikace přijdeme.

Jak Anopress ukládá publikace do databáze

Tento proces se liší dle typu publikace, tedy zda jde o tisk, televizní záznam, rozhlas anebo sociální síť.

V případě tisku je buď článek zaslán v elektronické podobě, což je nejjednodušší možnost. Článek se pak sváže s náhledem, zdrojem, opatří se potřebnými metadaty a následně se nahraje do databáze. Pokud článek přijde v grafické podobě, například přední strana novin, je použit speciální software, který identifikuje článek a přepíše jej do textové podoby. Následně je nahrán do databáze.

Co se týče televizních a rozhlasových záznamů, dříve veškeré zpracování probíhalo ručně, nyní je již většinou automatizované a ručně je pak prováděna editace. K veškerým publikacím tohoto typu tak existuje jak textový přepis, tak odkaz na nahrávku. Důležitou činností je pak zde také identifikace mluvčího.

U webmonitoringu se dříve využívali RSS kanály, dnes však Anopress využívá crawlery. Sociální sítě jsou také automaticky nahrávané, ovšem stojí za zmínku, že jsou pozorované jen veřejné profily.

Licence

Společnost NEWTON Media nabízí dva druhy ročních licencí přístupu do databáze Anopress pro instituce s jedním uživatelským přístupem. Přístup je dostupný nepřetržité a váže se k heslu a IP adrese. S možností přihlašování odkazem, kdy pak není potřeba heslo. Tento přístup využívá většina knihoven a škol, které chtějí zpřístupnit databázi svým uživatelům.

První z nich je přístup s pouze možností prohlédnout si články, které jsou jeden rok staré. V tom případě je cena na rok 1 000 Kč bez DPH. Druhá licence je pak plnohodnotná, tedy s možností prohledávat všechny články až do roku 1996. Cena této licence činí 2 750 Kč bez DPH (dle informací k roku 2019). (Veřejné informační služby knihoven, 2020)

Příklady využití

Databáze Anopress skýtá mnoho možností využití. Jednak k hledání vydaných publikací o vlastní firmě, produktech nebo například o konkurenci. Zjištění informací o oboru, ve kterém člověk působí a hlavně nových inovací v daném odvětví. Možné nové příležitosti a trhu, či obecně informace o aktuálním dění. Nebo například hledání informací o konkrétních osobách jako jsou obchodní partneři, politici, či jiné známe osobnosti.

Databáze je pak častým zdrojem pro studenty při psaní jejich závěrečných prací. To hlavně díky tomu, že společnost spolupracuje s několika vysokými školami, a tak studenti těchto škol mají k databázi Anopress volný přístup. Mezi tyto školy patří například Vysoká škola Ekonomická v Praze, Masarykova univerzita nebo Univerzita Karlova. (Anopress, 2020)

Společnost Anopress pak také od konce roku 2019 zahájila spolupráci se společností EBSCO Information Services a tak nově EBSCO Discovery Service™ indexuje i databázi Anopress. Plný text se však zobrazí jen v případě, že má daný uživatel do databáze Anopress přístup. (EBSCO Information Services, 2019)

Zdroje

Anopress IT, a.s. Anopress [online]. Copyright © 2020 NEWTON Media, a.s. [cit. 05. 02. 2021]. Dostupné z: https://www.anopress.cz/

EBSCO Information Services. EBSCO Discovery Service nově indexuje databázi Anopress [online]. 17. 12. 2019 [cit. 07. 02. 2021]. Dostupné z: https://www.ebsco.com/e/cs-cz/blog/novinky-ebsco-discovery-prosinec

Masarykova univerzita. T Monitoring on-line [online]. © 2019 Masarykova univerzita. [cit. 05. 02. 2021]. Dostupné z: https://ezdroje.muni.cz/prehled/zdroj.php?id=198&lang=cs

MAV. Anopress monitoruje postoje, emoce a nálady. In: Mediaguru.cz [online]. 2019 [cit. 05. 02. 2021]. Dostupné z: https://www.mediaguru.cz/clanky/2019/06/anopress-monitoruje-postoje-emoce-a-nalady/

Veřejné informační služby knihoven. Dokumenty — Veřejné informační služby knihoven [online]. Copyright © Národní knihovna ČR [cit. 07. 02. 2021]. Dostupné z: https://visk.nkp.cz/dokumenty

Wikipedie: Otevřená encyklopedie. Anopress [online]. © 2020 [cit. 05. 02. 2021].  Dostupné z: https://cs.wikipedia.org/wiki/Anopress

Data.gov.uk ako brána pre prístup k dátam zo Spojeného kráľovstva

0

Úvod

Data.gov.uk patria k prvým a celosvetovo uznávaným portálom s open government dátami. Od svojho založenia v roku 2010 umožňujú prístup pod otvorenou licenciou k tisíckam datasetov, rozdelených do niekoľkých kategórií, ako sú napríklad doprava, vzdelanie a ekonomika prevažne v csv formáte. Počet datasetov neustále rastie a tiež vznikajú nové využitia týchto dát v rôznych aplikáciách. Zaujímavým využitím je aplikácia zobrazujúca úroveň kriminality vo vašom okolí, alebo ďalšia aplikácia pre cyklistov, ktorá vás varuje, ktorým miestam sa vyhnúť pri vašej trase, pretože sa tam stalo veľa nehôd cyklistov. V tomto článku sa pozrieme bližšie na celý príbeh data.gov.uk, čo všetko sú jeho prínosy a vysvetlíme si ako túto stránku používať.

Príbeh za vznikom data.gov.uk

Kľúčovú úlohu pre úspech projektu data.gov.uk zohrali Tim Berners-Lee a Nigel Shadbolt. Tim Berners-Lee, ktorý je považovaný za zakladateľa World Wide Webu prišiel k ďalšej revolučnej myšlienke a to otvoreným prepojeným dátam. Vo svojom článku Linked Data definuje pravidlá ako jednoducho tieto dáta prepojiť pomocou URI, jednoduchého identifikátoru prostriedku (Berners-Lee 2006). Vďaka tomuto článku vznikol medzi prvými projekt DBpedia, ktorá prepája rôzne dáta z wikipédie a umožňuje tak nájdenie nových spojitostí. Tim ďalej pokračoval v propagácii tejto myšlienky a výborne ju preslávil na TED konferencii, kde upozornil na obrovský nevyužitý potenciál prepojených otvorených dát pre rôzne sféry a hlavne pre boj s veľkými problémami, ktorým čelí svet (Berners-Lee 2009).

Profesor Nigel Shadbolt viedol projekt Advanced Knowledge Technologies (AKT), ktorý sa zaoberal témou použitia štandardov sémantického webu pre open government dáta. Výsledky tejto práce boli prezentované parlamentu Spojeného kráľovstva a na ich základe sa vytváral aj portál data.gov.uk (Shadbolt et al. 2012). Shaldbolt spomína, že závery tohto projektu zaujali aj ľudí vo vláde, ktorí boli naklonení ďalšiemu využitiu týchto poznatkov. Hovorí tiež, že hneď po vzniku tejto priaznivej nálady vo vláde bol aj veľmi dôležitý obed Gordona Browna, vtedajšieho premiéra a Tima Bernersa-Leho, ktorý presvedčil premiéra, aby im vláda dala dáta a oni ich výmenou za to premenia na web of data. Takto sa započal projekt data.gov.uk a celý tím pre jeho vznik mali na starosti práve už spomínané osobnosti Shadbolt a Berners-Lee. (SETsquared Partnership 2010).

Trvalo len rok od spustenia projektu a na portály sa objavilo niečo cez 6000 vládnych datasetov. Vďaka ich zverejneniu pod voľnou licenciou vzniklo niekoľko zaujímavých aplikácii. Okrem už spomínaných vznikla aj napríklad JustPark, ktorá umožní vyhľadať parkovacie miesto alebo si ho rezervovať dopredu (LinkedData.Center 2015). Potom aplikácia Fix My Street zjednodušila problém nahlasovania výtlkov a ďalších problémov s cestami kompetentným autoritám (Shadbolt 2011).

Open government dáta sa postupne stali trendom vo svete, a nakoniec dorazili aj do našich končín. Úplne prvou stránkou s open gevernment dátami bola americká data.gov, ktorá vznikla za podpory Obamovej administratívy. Druhou nato bola britská data.gov.uk. Neskôr u nás vznikli národné portály pre prístup k otvoreným dátam ako sú data.gov.cz a data.gov.sk. Metropoly oboch krajín prišli s vlastnými iniciatívami, ktoré pre Česko predstavuje Praha s opendata.praha.eu a na Slovensku Bratislava s opendata.bratislava.sk.

Čo priniesli data.gov.uk?

So začatím používania portálu nastal zásadný posun mentality zo strany štátnej aparatúry. Zmenil sa postoj udržiavania dát u seba a prípadného sprístupnenia za nejaký poplatok na zverejňovanie všetkých dát pod voľnou licenciou až na tie, ktoré sú súkromného charakteru. Shaldbolt hovorí, že práve táto zmena prináša vytváranie oveľa väčšej hodnoty, ako by boli niekde nečinne uložené, prípadne zverejnená len ich časť na požiadanie a za poplatok (SETsquared Partnership 2010).

Kapoor, Weerakkody a Sivarajah prehľadne zhrnuli benefity, ktoré by mali používaním open government platform vzniknúť. Prvou je zvýšenie transparentnosti zo strany štátu. Zverejnené vládne dáta by mali zvýšiť dôveru občanov a zároveň im umožniť lepšiu verejnú kontrolu nad tým, čo sa deje v štáte. Ďalším prínosom by mala byť podpora ekonomického rastu. Zverejnenie týchto dát pod otvorenou licenciou, by malo umožniť trhu vytvoriť nové produkty a služby. Tie by mali zvýšiť produktivitu, niektorej štátnej inštitúcie alebo inej spoločnosti naviazanej na dané dáta. Vzniknutie nového produktu by malo priniesť zamestnanosť a tá zase priniesť príjem pre štát vo forme daní. Za sociálny benefit môžeme považovať nové možnosti interakcie občanov s vládou. Tie by mali byť interaktívne a zároveň lepšie poskytovať informácie. Ďalej by malo dôjsť k zvýšeniu efektivity a redukcii nákladov inštitúcii, pretože získavanie dát je časovo a finančne náročne. Tým, že sa dáta otvorili verejnosti, by malo dôjsť k zvýšeniu ich kvality, keďže sú dostupné k verejnej kontrole. Tá by mala upozorniť na chýbajúce a nesprávne dáta. Shadbolt spomína príklad ako sa prvýkrát zverejnil zoznam všetkých autobusových zastávok v uk a za krátku dobu verejnosť prišla na to, že cez 12% zo všetkých zastávok je na úplne inom mieste, ako by mali byť podľa daného datasetu (SETsquared Partnership 2010). Podpora inovácii je tiež dôležitým benefitom. Nové poskytnuté dáta sú príležitosťou pre vývojárov k tvorbe nových inovatívnych riešení (Kapoor et al. 2015, s. 264).

Data.gov.uk majú význam nielen pre podporu transparentnosti a inovácii, ale aj vo vede. Štúdia od Yana a Webera z Washingtonskej univerzity, ktorá skúmala využitie open government dát v peer-reviewed literatúre zistila, že tento druh zdrojov dát sa využíva stále viac a to naprieč rôznymi vedeckými disciplínami. Najviac využívaným zdrojom z celkovo 1229 skúmaných článkov boli práve data.gov.uk a boli dokonca ešte viac používané ako americký portál data.gov. Najčastejšie používaným datasetom v skúmaných článkoch tejto štúdie bol „index of deprivation“ a bol používaný hlavne v oblasti výskumu verejného zdravia a medicíny (Yan a Weber 2018).

Vedecké disciplíny využívajúce open government dáta vo výskume
Vedecké disciplíny využívajúce open government dáta vo výskume (Yan a Weber 2018)
Prehľad 30 najpoužívanejších OGD stránok vo výskume (Yan a Weber 2018)
Prehľad 30 najpoužívanejších OGD stránok vo výskume (Yan a Weber 2018)

Ako používať data.gov.uk

Stránka prešla zásadným redizajnom v roku 2018, aby viac zapadala do siete ostatných vládnych stránok Spojeného kráľovstva a zároveň sa zjednodušila pre bežného používateľa. Vďaka tomu zmizlo aj viacero zaujímavých podsekcií stránky, ako napríklad rôzne štatistiky používania webu, alebo prehľad aplikácii používajúcich open dáta z tejto stránky.

Pôvodný dizajn stránky Zdroj: https://web.archive.org/web/20170710012634/https://data.gov.uk/data/site-usage#totals
Aktuálny vizuál po redizajne stránky Zdroj: https://data.gov.uk/

Kategórie

Hneď na domovskej stránke je rázcestie s kategóriami, do ktorých sú roztriedené jednotlivé zverejnené dáta. Kategórie sú prehľadné a zrozumiteľné aj pre laického používateľa. Nižšie je uvedený ich zoznam aj s popisom obsahu:

Business a ekonómia

  • Datasety o medzinárodnom obchode (clá, export, import), daniach, devízových rezervách, covid pomoci pre ekonomiku, malých a stredných podnikoch a vývoji priemyslu všeobecne.

Zločin a spravodlivosť

  • Základné prehľadové datasety o polícií, súdoch a väzniciach (lokalita, zamestnanci). Ďalej dáta o kriminalite, napríklad o podvodoch, alebo podpaľačstve. Tiež sa zaznamenávajú aj údaje o tom, kedy boli použité strelné zbrane políciou. Ďalej tu sú datasety o situácii na hraniciach a imigrácií.

Obrana

  • Sprístupnené dáta o vojenských zložkách, civilných zamestnancoch v armáde, penzijných schémach pre armádu, ostrých streľbách vo vojenských obvodoch, bezpečnostnej situácii, zdravotných incidentoch v armáde, pátracích a záchranných operáciách.

Vzdelanie

  • Údaje o zamestnancoch v školstve, o knižniciach, mládežníckych organizáciách, dochádzke študentov, školách, kvalifikáciách a národnom kurikulu.

Životné prostredie

  • Dáta o životných podmienkach zvierat, vývoji počasia, oblastiach s rôznymi formami environmentálnej záťaže, živelných pohromách, ochrane lesov, riek, kvality vzduchu, geologické dáta a poľnohospodárstvo.

Vláda

  • Prehľad o riadení pracovných síl, platy zamestnancov, inovačné a výkonnostné reporty, nehnuteľnosti, záznamy o stretnutiach s externými organizáciami a business plány oddelení.

Vládne výdaje

  • Datasety so všetkými platby v štátnom sektore nad 25 000 libier.

Zdravotníctvo

  • Dáta o zdravotných testoch, fajčení, drogách, alkohole, potravinovej hygiene, prevencii rakoviny, účinnosti liečby a výdaje nemocníc nad 25 000 libier.

Mapovanie

  • Rôzne mapy lokalít (morské dno a suchozemský terén) a adresy, vlastníctva pozemkov, letecké fotografie, parkovacie zóny, stav ciest , volebné miestnosti a zastávky hromadnej dopravy.

Spoločnosť

  • Zamestnanosť, podpora v nezamestnanosti, nezamestnanosť mladých, komunitné služby, rodinné financie, nízkopríjmové skupiny obyvateľstva, viera, populácia a jej mobilita.

Mestá

  • Bývanie, územné plánovanie, verejné priestranstvá, voľný čas, lokality prípojok na inžinierske siete, energie a odpady, spotreba, zelená infraštruktúra a bezdomovectvo.

Doprava

  • Letiská, cesty, plánované rekonštrukcie ciest, osvetlenie ciest, nákladná doprava, železničná sieť, elektrické autá, parkovanie, autobusy, hustota dopravy, lokality semaforov, chodníky, cyklotrasy a licencie pre taxislužby (data.gov.uk 2021).

Filtre

Po výbere konkrétnej kategórie, ktorá nás zaujala si môžeme ešte viac spresniť naše vyhľadávanie pomocou dostupných filtrov. Prvým je filter podľa inštitúcie, ktorá dané dáta zverejnila. Zoznam dostupných inštitúcií sa líši podľa našej predchádzajúcej voľby kategórie a priebežne sa aktualizuje. Nižšie na obrázku môžeme vidieť filter podľa inštitúcie v kategórií obrana.

Filter s voľbami inštitúcií. Zdroj: https://data.gov.uk/

Druhým filtrom, podľa ktorého môžeme spresniť naše vyhľadávanie je filter podľa dátového formátu. Väčšina prístupných súborov je v csv formáte, ale niekedy sa nájdu aj iné ako napríklad json, xlsx a ďalšie.

Filter s voľbou dátového formátu. Zdroj: https://data.gov.uk/

Tretí z dostupných filtrov je zameraný na licenciu, pod ktorou sú zverejnené datasety. Väčšina z datasetov na data.gov.uk je zverejnená pod voľnou licenciou Open Government Lice, ale pre istotu je vhodné zaškrtnúť toto políčko a ústiť sa, že skutočne spadajú pod spomínanú licenciu.

Filter pre Open Government Licenciu. Zdroj: https://data.gov.uk/

Výsledky vyhľadávania si môžeme zoradiť podľa dátumu pridania datasetu, alebo podľa zhody s našim vyhľadávaním.

Filter pre zoradenie podľa dátumu pridania, alebo najlepšej zhody. Zdroj: https://data.gov.uk/

Open Government Licence

Ako už bolo spomenuté, majorita datasetov na data.gov.uk spadá pod open governmnet licence. Tá je aktuálne v tretej verzii a umožňuje:

  • Kopírovať, publikovať a distribuovať informácie
  • Prispôsobiť informácie
  • Využívať informácie komerčným a nekomerčným spôsobom, napríklad ich kombinovaním s ostatnými informáciami, alebo ich využitím vo vlastnom produkte, či aplikácii

Pri použití dát je nutné:

  • Potvrdiť zdroj informácie vo vašom produkte, alebo aplikácii pomocou výslovného uvedenia prehlásenia (attribution statement, ktorý je špecifikovaný poskytovateľom) o zdroji, alebo uvedením prepojenia naň. A ak je to možné uviesť aj odkaz na Open Government Licenciu.

Niektoré výnimky z licencie:

  • Súkromné dáta
  • Doklady totožnosti, ako je napríklad cestovný pas
  • Vojenské insígnie
  • Intelektuálne vlastníctvo, ako sú patenty a ochranné známky

Podrobnejší zoznam výnimiek, ďalšie špecifikácie k licencii a znenia predchádzajúcich verzií sú uvedené na stránke národného archívu: http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/

Princípy publikovania dát na data.gov.uk

Profesor Shadbolt predstavil na konferencii IIEA niekoľko zásadných princípov publikovania dát, vyžadovaných od vládnych inštitúcii pre data.gov.uk. Jedným z problémov, s ktorým sa pri projekte stretli bol problém takzvaného „data huggingu“, keď inštitúcie veľmi neradi sprístupňovali svoje dáta hocikomu inému. To sa snažili zmeniť a vytvoriť princíp, kde sa publikujú všetky dáta až na tie, u ktorých máme dobrý dôvod ich nezverejňovať (napríklad súkromné dáta). Ďalším navrhovaným princopom je, že publikované dáta by mali byť v znovu použiteľnom a strojovo čitateľnom formáte. Tiež dáta by sa mali publikovať pod otvorenou licenciou, ktorá umožňuje opätovné použitie aj pre komerčné účely (Open Government Licence). Verejné inštitúcie majú práve podporovať a propagovať používanie týchto dát verejnosťou. Pre lepšie pochopenie ako čo najlepšie publikovať dáta navrhli používať pomôcku od Tima Bernersa-Leeho „Five stars to stardom“, ktorá pomocou počtu hviezdičiek určuje kvalitu zverejnených dát (Shadbolt 2011).

* Zverejniť dáta na web v hociktorom formáte

** Zverejniť ich v štruktúrovanom formáte

*** Používať tvorené štandardy a formáte pre zverejnené dáta

**** Používať URL k identifikácii dát

***** Prepojiť naše zverejnené dáta s ostatnými zverejnenými dátami

Ak by boli dáta zverejnené aj s prepojením na ostatné dáta, tak sa odstráni ďalší častý problém, ktorý sa vyskytoval v projekte a to „dátové silá“. Koncept dátových síl predstavuje jednotlivé oddelenia, alebo inštitúcie, ktoré disponujú dátami, avšak vôbec nie sú medzi sebou prepojené a preto sa nevyužíva ich plný potenciál .

Ilustrácia dátových síl. Zdroj: https://pixabay.com/sk/photos/sil%C3%A1-skladovanie-obilia-1598168/

Ako používať data.gov.uk?

Používanie data.gov.uk je veľmi jednoduché, ale pozrime sa na jeden konkrétny príklad. Dajme tomu, že chceme nájsť aktuálne dáta o hlučnosti pre jednotlivé lokality v Spojenom kráľovstve. Pre efektívnejšie vyhľadávanie využijeme možnosť voľby kategórie aj filtre. Na začiatok si zvolíme príslušnú kategóriu, kde očakávame, že by sa mali údaje o hlučnosti nachádzať. Preto si pre naše vyhľadávanie zvolíme životné prostredie (Environment). Dáta chceme mať vo vhodnom formáte pre prácu s nimi a preto si v ďalšom filtri volíme formát csv. Ďalej ešte zaškrtneme filter pre zobrazenie dát len pod Open Government Licenciou. Pre zobrazenie najaktuálnejších dát si ešte zvolíme zoradenie podľa najnovších dát namiesto najväčšej zhody. Do vyhľadávacieho poľa použijeme výraz noise exposure, ktorý by mal dobre reprezentovať náš predmet vyhľadávania.

Ukážka vyhľadávania č.1 Zdroj: https://data.gov.uk/

Po spustení vyhľadávania by sme mali dostať podobný výsledok.

Ukážka vyhľadávania č.2 Zdroj: https://data.gov.uk/

V čase písania tohto článku bol najaktuálnejším datasetom Noise Exposure data – Round 3. Na stránke venovanej nemu si môžeme pozrieť detailnejšie informácie o ňom, kedy bol prevedený poslednýkrát update, podrobnejší popis datasetu a s nim súvisiace datasety.

Ukážka vyhľadávania č.3 Zdroj: https://data.gov.uk/
Ukážka vyhľadávania č.4 Zdroj: https://data.gov.uk/

Pred stiahnutím dát si ich ešte môžeme pozrieť v náhľade. Alebo ak by sme našli nejaké nezrovnalosti, prípadne mali otázku ohľadom dát, môžeme kontaktovať danú inštitúciu zodpovednú za dataset.

Ukážka vyhľadávania č.5. Zdroj: https://data.gov.uk/

Pre pokročilejších používateľov je k dispozícií prístup pomocou API. Používa sa CKAN API a detailný návod ako s ňou pracovať je na stránke: https://docs.ckan.org/en/2.7/api/index.html

Záver

Data.gov.uk sú skutočne výborným zdrojom dát z prostredia Veľkej Británie. To dokazujú užitočné aplikácie, ktoré vďaka nim vznikli, ale aj veľké množstvo výskumných projektov z rôznych vedeckých disciplín. Výraznejšie zverejňovanie umožnilo lepšiu kontrolu zo strany verejnosti a vytvorilo priestor pre inovácie. Dizajn stránky je prehľadný a vie sa v ňom zorientovať aj menej skúsený používateľ. Akurát by sa dalo vytknúť, že nie vždy všetky datasety sú v najlepšej kvalite a možno by mohli byť častejšie aktualizované. Avšak celkovo sa jedná o prínosnú stránku, na ktorej sa dá nájsť jednoducho veľké množstvo užitočných informácii.

Použité zdroje:

BERNERS-LEE, Tim, 2006. Linked Data. https://www.w3.org/ [online] [cit. 7.2.2021]. Dostupné na: https://www.w3.org/DesignIssues/LinkedData.html

BERNERS-LEE, Tim, 2009. Tim Berners-Lee: The next Web of open, linked data – YouTube [online] [cit. 7.2.2021]. Dostupné na: https://www.youtube.com/watch?v=OM6XIICm_qo&ab_channel=TED

DATA.GOV.UK, 2021. Find open data – data.gov.uk. data.gov.uk [online] [cit. 10.2.2021]. Dostupné na: https://data.gov.uk/

KAPOOR, Kawaljeet, Vishanth WEERAKKODY a Uthayasankar SIVARAJAH, 2015. Open Data Platforms and Their Usability: Proposing a Framework for Evaluating Citizen Intentions. V: Marijn JANSSEN, Matti MÄNTYMÄKI, Jan HIDDERS, Bram KLIEVINK, Winfried LAMERSDORF, Bastiaan VAN LOENEN a Anneke ZUIDERWIJK, ed. Open and Big Data Management and Innovation [online]. Cham: Springer International Publishing, s. 261–271. Lecture Notes in Computer Science. ISBN 978-3-319-25013-7. Dostupné na: doi:10.1007/978-3-319-25013-7_21

LINKEDDATA.CENTER, 2015. Almost 400 apps that use uk gov open data – documentation portal [online] [cit. 10.2.2021]. Dostupné na: http://sites.linkeddata.center/help/business/cases/296-apps-that-use-uk-datasets

SETSQUARED PARTNERSHIP, 2010. Transparency and Open Data: data.gov.uk [online]. [Youtube]. 2010. SETSQUARED PARTNERSHIP. Dostupné na: https://www.youtube.com/watch?v=vBNPIiKi00w&t=432s&ab_channel=SETsquaredPartnership

SHADBOLT, Nigel, 2011. A year of data.gov.uk. The Guardian [online]. 2011 [cit. 10.2.2021]. Dostupné na: https://www.theguardian.com/news/datablog/2011/jan/21/data-gov-nigel-shadbolt-government

SHADBOLT, Nigel, 2011. Nigel Shadbolt on UK Government Open Data Initiative [online]. [Youtube]. 2011. SHADBOLT, Nigel. IIEA. Dostupné na: https://www.youtube.com/watch?v=srPinVmjBOE&t=595s&ab_channel=IIEA

SHADBOLT, Nigel, Kieron O’HARA, Tim BERNERS-LEE, Nicholas GIBBINS, Hugh GLASER, Wendy HALL a m c SCHRAEFEL, 2012. Linked open government data: lessons from Data.gov.uk. IEEE Intelligent Systems [online]. 2012, roč. 27, č. 3, s. 16–24. ISSN 1541-1672. Dostupné na: doi:10.1109/MIS.2012.23

YAN, An a Nicholas WEBER, 2018. Mining Open Government Data Used in Scientific Research. V: Gobinda CHOWDHURY, Julie MCLEOD, Val GILLET a Peter WILLETT, ed. Transforming Digital Worlds [online]. Cham: Springer International Publishing, s. 303–313. Lecture Notes in Computer Science. ISBN 978-3-319-78105-1. Dostupné na: doi:10.1007/978-3-319-78105-1_34

Opendatasoft: Udělejme data přístupnější všem

0

Úvod

S příchodem internetu exponenciálně roste objem dostupných informací a pro jedince je obtížné se v takovém množství orientovat. Hlavním problémem je nedostatečná kontrola kvality a nekontrolovatelný tok příchozích informací. Proto mnoho lidí trpí informačním přetížením, což je stav, během kteraého jsme obklopeni obrovským objemem dat a konzumujeme větší objem informací, než dokážeme zpracovat. Takové přetížení způsobuje, že jsme v dané problematice jen více zmatení, brání nám v přemyšlení a rozhodování se.

V dnešní době existuje velké množství informačních zdrojů, které nám umožnují efektivnější práci s vyhledáváním a zpracováním informací. Tyto zdroje mohou být jak tuzemské, tak zahraniční. Pro účely této práce byl vybrán Opendatasoft, který spadá pod francouzskou společnost, sídlící v Paříži.

Opendatasoft patří mezi SaaS platformy (software as a service). Společnosti platformu používají k přístupu, opětovnému použití a sdílení dat pro firemní rozvoj a obchodní růst. Data jsou rovněž zpřístupňována prostřednictvím API. Nástroj nám umožňuje organizovat, sdílet a vizualizovat různé typy dat do tabulek, grafů či map. Software je používán jak soukromými společnostmi, tak veřejnými subjekty.

Hlavním cílem Opendatasoft je nabízet veřejná data ve formě otevřených dat. Otevřená data jsou data, ke kterým mají přístup všichni uživatelé a mohou být využívána pro vlastní i komerční účely. Dříve byli klíčovými uživateli platformy především orgány francouzské vlády a místní komunity. Nyní je služba zpřístupněna veřejným i soukromým firmám po celém světě. Uživatelé služby mohou svá data poskytovat veřejně ostatním společnostem, či jen s omezeným přístupem, členům organizace nebo partnerským společnostem.

Opendatasoft nabízí různé druhy řešení:

  • Private Data Solution
  • Data Product
  • Open Data
  • Smart City and IoT

Opendatasoft obsahuje sadu různých funkcí pro:

  • shromažďování datových sad z různých zdrojů a v různých formátech
  • transformaci datových sad pomocí funkcí k přípravě dat
  • publikaci datových sad jako API
  • prozkoumání katalogu, vizualizaci jednotlivých datových sad nebo vytvoření kombinací datových sad

Katalog datových sad

Katalog se skládá z volně přístupných dat, ke kterým mají přístup všichni uživatelé, a soukromých dat, které jsou k dispozici pouze autentizovaným uživatelům.

Obrázek 1: Katalog Opendatasoft (Opendatasoft.com)

Na levé straně se nachází počet aktuálně dostupných datových sad s různými možnostmi řazení podle abecedního pořadí, data úpravy, počtu záznamů, počtu stažení či popularity. Dle výchozího nastavení je seřazení od nejnovějšího data k nejstaršímu datu úpravy. Dále můžeme sady pro snadnější vyhledání konkrétních data setů různě filtrovat. Platforma nabízí filtrování pomocí textového vyhledávání, jazyka data setu, portálu, témat, vydavatele a dalších parametrů. Opendatasoft nabízí stažení katalogu v různých formátech jako jsou např. .xls, .csv, .xml a další.

Na straně druhé jsou zobrazeny všechny dostupné datové sady dle vyhledávání. Každý obdélník tzv. „katalogová karta“ představuje jednu datovou sadu. Na kartách jsou zobrazena metadata, týkající se datových sad spolu s nástroji pro rychlou vizualizaci dat (tabulka, graf či mapa) a odkazy ke sdílení nebo opětovnému použití datové sady (export, API). Katalogové karty si mohou uživatelé zcela přizpůsobit dle vlastních preferencí.

Vyhledávání datové sady

Dotazovací jazyk Opendatasoft umožňuje fulltextové dotazy. Pokud je slovo či slovní spojení napsané v uvozovkách, Opendatasoft vrátí pouze přesné shody daného slova.

  • photo vrací výsledky, které obsahují photo, photography, photograph, photographer…
  • „photo“ vrátí pouze datové sady, které obsahují přesnou shodu slova

Platforma podporuje dotazování pomocí booleovských operátorů AND, OR a NOT. Výrazy lze prostřednictvím závorky kombinovat mezi sebou.

Další z funkcí dotazovacího jazyka je filtrování výsledků na základě hodnoty konkrétního pole. Názvy polí odpovídají dostupným metadatům. Při vyhledávání datové sady uvedeme v dotazu název pole jako předponu.

Názvy polí jsou:

  • publisher – vydavatel datové sady
  • title – název datové sady
  • description – popis datové sady
  • license – licence k datové sadě
  • records_count – počet záznamů v datové sadě
  • modified – datum poslední úpravy
  • language – jazyk datové sady (iso kód)
  • theme – téma datové sady
  • references – odkazy na datovou sadu

Vyhledávání v datech

Dotazy se zadávají do vyhledávacího pole v sekci Filters. Zadáním pojmu či slovního spojení, které nás zajímá, se nám vrátí každý záznam obsahující klíčová slova v datech.

id_field:value – příkaz, který nám vrátí všechny záznamy obsahující určitou hodnotu v konkrétním sloupci

value1 AND value2 – příkaz nám vrátí záznamy, obsahující value1 a value2

value1 OR value2 – vrátí nám záznamy, obsahující alespoň jednu z definovaných hodnot

NOT value – vrátí každý záznam, který neobsahuje zadanou hodnotu

#exact(id_field,“value“) – definování přesné hodnoty, která má být obsažena ve sloupci id_field, například, #exact(host_name, „Alexa“) vrátí záznamy s jménem hostitele obsahujícím přesně „Alexa“ a nic jiného

#null(id_field) – vrátí všechny záznamy, které mají v definovaném sloupci prázdnou hodnotu

id_date_field>=YYYY/MM/DD – vrátí všechny záznamy, u kterých je datum poslední recenze rovno nebo větší než zadané datum

Ve vyhledávání lze za název pole umístit různé operátory:

  • :, =, ==: zobrazí výsledky, které se přesně shodují s hodnotou (hodnoty pole mohou být textového nebo číselného typu)
  • >, <,> =, <=: zobrazí výsledky s hodnotami pole, které jsou větší, menší, větší nebo rovno, menší nebo rovno jako hodnota, v případě, že se jedná o datum nebo číselnou hodnotu
  • [start_date TO end_date]: zobrazí záznamy mezi start_date a end_date

Práce v Opendatasoft

Publikace datové sady

Práce v platformě Opendatasoft bude demonstrována na příkladu datové sady o kriminalitě a bezpečnosti z policejního oddělení ve městě Cary za posledních 10 let. Nejprve je potřeba načíst datovou sadu kliknutím na tlačítko Create my first dataset. V náhledu je zobrazena možnost přejmenování datové sady, zvolíme jasný a výstižný název.

Obrázek 2: Datová sada – Police incidents (Opendatasoft.com)

Po úspěšném nahrání dat si na kartě Processing definujeme filtry, s jejichž pomocí budeme později vytvářet grafy. Ve sloupcích, u kterých chceme nastavit filtrování, klikneme na ikonku filtru. Opendatasoft nám dále umožňuje úpravu dat přímo v platformě. Na kartě Information k datové sadě přidáme popis dat, téma, klíčová slova a další metadata. Nakonec data uložíme a publikujeme.

Obrázek 3: Publikace datové sady (Opendatasoft.com)

Publikovaná data můžeme dále v programu vizualizovat a analyzovat z různých pohledů:

  • Table view – výchozí zobrazení dat
  • Map view – zobrazení mapy je možné jen v případě, kdy v datové sadě máme k dispozici zeměpisné souřadnice
  • Analyze view – slouží k tvorbě grafů (sloupcové, koláčové, pruhové, spojnicové a další)

V záložce Embed se nám vygeneruje URL link, pomocí kterého můžeme sdílet vytvořené vizualizace s ostatními členy týmu či partnery veřejně. V případě změny původních dat se pomocí API veškeré vizualizace vložené na web aktualizují podle nových dat v reálném čase.

Využití

Příklady využití lze nalézt v mnoha různých odvětvích např. v energetice, veřejných službách, místních komunitách, dopravě, vládě, bankovnictví, pojišťovnictví a dalších. Velkou hodnotu mohou veřejná data přinést lokálním společnostem, jelikož platforma obsahuje velké množností datových sad z Francie (13,299 z 21,213 datových sad). Dále platforma zahrnuje anglické, německé, španělské či holandské datové sady.

Závěr

Opendatasoft nám poskytuje velké množství otevřených dat, která můžete volně sdílet, šířit a využívat ve svých projektech i komerčně. Využití najdou převážně místní společnosti, jelikož se jedná o francouzskou platformu a hlavními poskytovateli dat jsou zejména města, dopravní podniky, vládní instituce a další veřejné subjekty. Města mohou data dále využívat při plánování strategií či vytváření různých projektů sloužících k občanskému využití. Kromě veřejně přístupných dat nám Opendatasoft nabízí užitečné funkce spojené s prací s daty. Nástroj nám umožňuje organizaci, transformaci, sdílení a vizualizace různých typů datových sad na jednom místě.

Použité zdroje

[1] Opendatasoft [online]. [cit. 2021-02-10]. Dostupné z: https://www.opendatasoft.com/

[2] Navigating the catalog. Help.opendatasoft [online]. 2021 [cit. 2021-02-10]. Dostupné z: https://help.opendatasoft.com/platform/en/exploring_catalog_and_datasets/01_navigating_the_catalog/catalog.html

[3] Searching in the data. Help.opendatasoft [online]. 2021 [cit. 2021-02-10]. Dostupné z: https://help.opendatasoft.com/platform/en/exploring_catalog_and_datasets/03_searching_the_data/search.html

Seznam obrázku

Obrázek 1: Katalog Opendatasoft (Opendatasoft.com)

Obrázek 2: Datová sada – Police incidents (Opendatasoft.com)

Obrázek 3: Publikace datové sady (Opendatasoft.com)

VisualPing.io: Monitoring webů pro každého

0

Úvod

Každý z nás již někdy netrpělivě očekával výsledky důležité zkoušky, nové informace o konkurenčním produktu, či jsme očekávali zlevnění našeho vysněného zboží. Při tomto očekávání denně nebo dokonce každou hodinu obnovovali webové stránky doufajíc ve zveřejnění tíženého obsahu. V této oblasti nám může pomoaci nástroj VisualPing.io.

Co je VisualPing?

VisualPing je nástroj, který dle vašich požadavků dokáže ve vámi zadaném časovém intervalu kontrolovat změny na webové stránce a upozornit vás na její případné změny.

Této funkce lze využít pro soukromé účely. Například pro sledování ceny produktu, který chcete zakoupit, pro sledování aktualit na stránkách školy či zaměstnavatele, nebo pro hlídání volné pozice ve vaší vysněné firmě.

Stejně dobře lze ale využít této funkce i ve firemním prostředí, kde tento nástroj využijete pro sledování vaší konkurence, udržení si přehledu v nové legislativě, sledování nově zveřejněných dat, nebo jako kontrolu zobrazení vaší webové stránky z pohledu koncového uživatele.

Tento online nástroj je navíc zdarma dostupný jako rozšíření webového prohlížeče, widget na vaší webové stránce a v plánu je i mobilní aplikace.

Práce s VisualPing

Již na úvodní stránce online nástroje máme možnost si vytvořit náš první „Job“. Tento formulář zároveň slouží k registraci nového uživatele. (Viz. Obrázek 1) Pro vytvoření našeho prvního Jobu nepotřebujeme nic víc než URL adresu stránky, kterou chceme sledovat, a emailovou adresu, kam chceme report zasílat.

Obrázek 1: Část úvodní strany VisualPing.io obsahující formulář k vytvoření Jobu. [Zdroj: visualping.io]

Z Obrázku 1 lze okamžitě vysledovat většinu pokročilého nastavení, které vám aplikace dává k dispozici, a se kterým vás v následujících odstavcích obeznámím.

Nejdříve je však dobré se seznámit s vylepšeným prostředím, které vám umožní správu všech vašich Jobů. (Obrázek 2) Na levé straně obrazovky naleznete seznam všech Jobů a zároveň okno pro rychlé vyhledávání. Napravo naleznete detail konkrétního Jobu včetně historie již proběhlých kontrol. A v záhlaví stránky pak naleznete informace o zbývajících kontrolách daný měsíc, přístup k nastavení účtu a případnému přechodu k měsíčnímu předplatnému.

Obrázek 2: Rozhraní správy Jobů. Použitá stránka náhledu https://fis.vse.cz/ [Zdroj: autor]

Jakých funkcí v rámci VisualPing lze vlastně tedy využít? Je to:

Nastavení periodicity, kde máte možnost vybrat z devíti časových úseků od 5 minut do 1 týdne. Zároveň je vám v pokročilém nastavení umožněno z těchto intervalů vyloučit specifické dny v týdnu a konkrétní čas, kdy daný Job má probíhat. Tím vám VisualPing umožňuje šetřit jednotlivými kontrolami, což vám ve výsledku šetří peníze.

Selekce části stránky pak zařídí, abyste sledovali pouze ty změny, které vás opravdu zajímají. Tato funkce je dostupná ve dvou variantách. V první lze sledovat vámi nastavenou vizuální výseč stránky a druhá vám pak umožňuje vybrat konkrétní předem identifikovaný prvek stránky. Tento druhý způsob vám poskytuje vyšší odolnost proti změně rozložení stránky.

Sledování změny textu je nejjednodušší způsob kontroly stránky. API zkontroluje celou stránku a upozorní vás na jakoukoli textovou změnu. Tuto funkci lze omezit pomocí klíčových slov, kdy upřesníte slovo či slovní spojení, které vás zajímá, a jestli se má jednat o jeho odstranění nebo naopak přidání.

Zabezpečení proti falešným upozorněním nabízí možnosti jako je dvojitá kontrola, prodleva před pořízením snímku obrazovky, užívání fixní IP adresy a v případě vizuálního ověření procentuální změna oproti poslednímu obrázku. Tato změna lze nastavit v pěti variantách: Any, Tiny (1 %), Medium (10 %), Major (25 %), Gigantic (50 %).

Proxy. Aplikace vám v základu nabízí možnost navštívit stránku pomocí proxy serveru 12 různých zemí. Pro firmy pak nabízí zřízení přihlášení z vlastní domény.

Notifikace lze v pokročilém nastavení posléze rozšířit o zprávy na Slack, discord, Rss a dalších platformách.

Akce jsou poslední a nejzajímavější funkcí VisualPing. Tato funkce vám umožňuje nastavit akce, které se mají stát předtím, než bude screenshot pořízen. Tuto funkci tak lze použít například pro přihlášení do systému nebo pro zablokování určitých prvků reklamy, které by případně spouštěly falešné notifikace. Prvky stránky můžete identifikovat ve vizuálním rozhraní nabízeným aplikací, přímo pomocí Xpath, nebo u některých příkazů lze vybrat rovnou celou třídu elementů.

K dispozici máte příkazy: Click, Type, Select, Block, Wait, iFrame, Cookie a Refresh.

Obrázek 3: Příklad využití akcí. [Zdroj: visualping.io]

Pricing

VisualPing nabízí buďto standardizované ceny pro jednotlivce, a to buďto ve verzi měsíčního předplatného, které se dále dělí dle velikosti balíčku, nebo verzi pay per use, která vám umožní koupit určitý počet kontrol a ty smíte spotřebovat kdykoli.

Druhý ceník je pro podniky. Tento ceny jsou udělovány vždy po předchozí domluvě s klientem a mohou být individualizované dle potřeb klienta.

Závěr

Ve zkratce je tedy VisualPing velmi užitečný nástroj pro úplné laiky, i pro pokročilé uživatele. Tento nástroj umožňuje kontrolovat změny na jakémkoli webu. Díky jeho obsahem téměř neomezeným hranicím může sloužit jako competitive intelligence nástroj pro velmi širokou škálu firem. Úplný laik sice může při špatném zacházení s tímto nástrojem dostávat falešná upozornění. Mírně pokročilým uživatelům však jejich zamezení i s dalšími užitečnými funkcemi nástroj nabízí. Jeho nedostatkem pro pokročilého uživatele by pak mohla být nedostatečná volnost v personifikaci vlastních Jobů. Například totiž periodicitu kontrol si uživatel nemůže nastavit sám, ale musí vybrat z předem definovaných možností.

Zdroje

[1] VisualPing – Website monitoring [online]. [cit. 10.2.2021]. Dostupné z: https://visualping.io/

[2] VisualPing – FAQ [online]. [cit. 10.2.2021]. Dostupné z: https://visualping.io/faq

Seznam obrázků

Obrázek 1: Část úvodní strany obsahující formulář k vytvoření Jobu. [Zdroj: autor]

Obrázek 2: Rozhraní správy Jobů. Použitá stránka náhledu https://fis.vse.cz/ [Zdroj: autor]

Obrázek 3: Příklad využití akcí. [Zdroj: visualping.io]

Feedly pomáhá hledat signály a potlačovat nežádoucí šum

0

Úvodní představení Feedly

Dnešní doba je mimo jiné specifická množstvím a dostupností informací, ke kterým má člověk přístup prakticky odkudkoliv. Díky tomu si člověk může najít co ho zajímá, na druhou stranu může pro hledané téma najít tisíce příspěvků a vybrat si ten správný, může být obtížné. S ohledem na množství1 a dostupnost informací není těžké dospět k zahlcení. Tomu by měla zabránit webová aplikace Feedly.

Feedly je vnímán jako nástroj, který pomáhá s výběrem relevantních informací dle preferencí uživatele. Cílem je agregovat zprávy na jedno místo z různých webových zdrojů, navíc je dokáže roztřídit do uživatelem vytvořených kategorií. Mimo sledování vybraných rubrik a článků, dokáže identifikovat článek dle klíčových slov, které si uživatel přeje sledovat. Feedly nemá plnit úlohu vyhledávače, lepší je si ho představit jako agregátor zpravodajských serverů, kde naleznete všechny články, které Vás zajímají.

Rešeršní možnosti a operátory vyhledávání

Webová aplikace má přehledné rozhraní a pro pokračování je důležité si vymezit hlavní pojmy. Na levé straně vidíme kromě hlavního menu také lištu, kde jsou dvě kategorie – Feeds a Boards.

Obrázek 1: Rozhraní webu Feedly. [zdroj obrázku: autor] 4

Feeds reprezentuje hlavní stránku, kterou je možné roztřídit do uživatelem vytvořených kategorií. Tyto kategorie agregují různé zdroje na jedno místo.

Mezi aktuálně podporované zdroje patří2:

  • Webové stránky – jednotlivé zpravodajské weby, i blogy (pro vybraná témata navrhuje i nejpopulárnější balíček zdrojů je sledování).
  • Klíčová slova – sledování zadaných klíčových slov napříč světově nejpopulárnějšími publikacemi (napojené na Google News)
  • Twitter – účty, tweety, hashtagy
  • Newsletter – extrakce z inboxu emailu
Obrázek 2: Návrh balíčků k danému tématu. [zdroj obrázku: autor] 4

Pro webové zdroje a klíčová slova je možné zvolit jazyk zdrojů, na základě vybraného jazyka nabízí nejpopulárnější zdroje – aktuálně podporuje 11 jazyků. U jednotlivých článků je uvedena jednoduchá metrika zajímavosti, jejíž hodnota je vytvářena komunitou Feedly. Funguje na jednoduchém principu – pokud si uživatel uloží článek na později, přidá to článku na významnosti. Do popředí se dostávají tedy články (pokud nemá uživatel nastaveno jinak), které jsou důležité pro celou komunitu sledující daný zdroj.

Obrázek 3: Metrika zajímavosti článků. [zdroj obrázku: autor] 4

Boards shromažďuje konkrétní uložené články z Feedu. Tyto články vybírá sám uživatel, buďto za účelem přečtení na později, archivaci nebo sdílení s týmem. Z hlediska hierarchie slouží jako podkategorie jednotlivých kategorií vytvořených ve Feedu.

Použití pro rešerše

Pro vytváření rešerší a získávání vhledů do různých témat, je použití Feedly určitě na místě. Dokáže práci velice zefektivnit a ušetřit čas. Avšak rešerši vnímá trochu jinak – není to proaktivní vyhledávání informací a zdrojů, ale spíše na základě definovaných pravidel vyhledává na pozadí vhodné články, zprávy. Spíše než k ojedinělému vyhledávání informací, se hodí na dlouhodobější sledování kategorií. Výhodou je aktualizované dodávání požadovaných informací, jednoduše řečeno, pokud se objeví nějaká novinka k Vámi hledanému tématu, tuto informaci budete mít ve Feedu. Může napomoci také k odhalování trendů v dané oblasti, když se objeví něco nového nebo zlomového, budete mít sjednocené informace na jednom místě. K tomu je potřeba, aby byl uživatel dostatečně pozorný a dokázal si uložené informace dát do širšího kontextu a identifikovat slabý signál, který by mu mohl poskytnout konkurenční výhodu. Bohužel není možné propojit Feedly se zdroji z deep webu. Může se zdát, že je možné propojit např s Web of Science, ale to zobrazuje pouze články ze Surface, které se týkají informací o daném zdroji, než aby zobrazoval nově vydané vědecké texty přímo ze stránky. Obzvlášť užitečné by bylo napojení na knihovnu obsahující legislativu (např. ASPI).

Leo Assistant

Prvotní klasifikaci užitečných článků zajišťuje Leo Assistant, který na základě námi definovaných pravidel zobrazí relevantní články. Leo je postaven na algoritmech umělé inteligence AI a za využití textové analýzy (NLP) rozlišuje co je užitečné (signál) a co ne (šum)3. Díky tomu máme k dispozici vytříděné požadované články, což vede k časové úspoře. Články roztříděné asistentem jsou označený zeleným labelem, po najetí na tento label se odůvodní zvolená akce. Užitečné je dávat asistentovi zpětnou vazbu na roztříděné články, které ovlivní jeho budoucí klasifikování – dochází ke trénování algoritmu na přání uživatele. Leo je součástí pouze placeného plánu za $ 8,25.4

Mezi hlavní poskytované funkce patří:

  • Topic:
    • Prioritizování na základě definovaných témat, klíčových slov, společností (např. o konkurenci) – možné kombinovat s dalšími funkcemi (Business Events)5
  • Like Board:
    • Pokud už máme vytvořený Board, necháme Lea naučit dané téma na námi vybraných užitečných článků. Leo si sám najde vzorce, které aplikuje pro další klasifikaci6
  • Business Events:
    • Identifikuje užitečné business události (financování akcí, uvedení produktů na trh nebo partnerství)7
  • Deduplication:
    • Zabraňuje shromažďování článků se stejnými informacemi. Může se stát, že jeden článek je zveřejněn ve více RSS feed. Užitečné třeba při zveřejnění nějakého produktu, technologie a články obsahují pouze minoritní změny8
  • Mute Filters:
    • Tak jako je možné vybrat si určit trendy, témata, klíčová slova, tak je možné zablokovat i nežádoucí9
  • Summarization:
    • K jednotlivým článkům vytvoří Leo shrnutí, to může uživateli ušetřit čas a zefektivnit práci10
Obrázek 4: Klasifikace článků pomocí Leo Assistant. [zdroj obrázku: autor] 4

K nastavení Leo asistenta je možné využít základní operátory, které je možné použít i pro specifikování jednotlivých témat, klíčových slov.

Feedly poskytuje tyto operátory:

  • Quotes – Chcete-li hledat přesnou frázi, přidejte uvozovky,
  • AND – Používá se mezi dvěma slovy – vyhledá obě slova v článku,
  • minus – Znaménko minus (-) vylučuje slovo nebo frázi, které následují za ním,
  • OR – Vyhledání více než jedné fráze nebo slova, kde se v článku musí objevit pouze jeden z výrazů,
  • intitle – K určení, jaké slovo má být obsaženo v nadpisu.11

Jednotlivé operátory je možné kombinovat a díky nim lépe zacílit vyhledávání.

Popis indexu a dostupnosti zdrojů

Uživatel si může přidat jakýkoliv zpravodajský zdroj – stačí zadat pouze název webu / URL / RSS zdroj. Pokud nemá žádný preferovaný zdroj, může zadat pouze téma, které ho zajímá a Feedly mu nabídne webové zdroje. K některým tématům má předpřipravené balíčky se zdroji, které je možné hromadně sledovat. Umožňuje přidat i podcasty, ale neumožňuje jejich přehrávání. Obecně jde říci, že je možný se propojit s jakýmkoliv zdrojem, který poskytuje RSS12. Do budoucna chtějí i připojení na Instagram.

Obrázek 5: Návrhy ke sledování vzhledem k napsanému slovu [zdroj obrázku: autor] 4

Kromě webových zdrojů je možné přidat i klíčová slova, které uživatele zajímají. Tyto klíčová slova jsou hledána na webové stránce news.google.com, která obsahuje světově nejpopulárnější publikace.11

Užitečném může být spojením s Twitterem. Je možné sledovat jednotlivé uživatele, ale také zveřejněné tweety, hashtagy. Buďto je možné sledovat tweety bez dalších odkazů anebo je možné sledovat tweety obsahující nějaký link (třeba na článek). Z Feedly je možné se přímo dostat jak na samotný Tweet, tak ale i na odkaz.13

Pokud má uživatel nastavený odběr k nějakému newsletteru, který mu pravidelně chodí do emailu, je možné propojit email s Feedly a mít tak další zdroj. Mnoho newsletterů může končit ve Spamu nebo v nevyžádané poště a nemusí se k uživateli dostat, navíc email není ideální místo na čtení zpráv. Z toho důvodu existuje právě i toto napojení.14

Příklady využití

Feedly nalezne vyšší uplatnění v agilním prostředí, které není úplně tak rigidní a spíše než dlouhodobé plánování, tak převažuje krátkodobé či situační. Své uplatnění může mít také při vytváření Ansoffovy matice. Pokud má být podnik úspěšný, a to i dlouhodobě, je potřeba aby inovoval. Feedly je velice silné ve spojení s nějakou knihovnou z deep webu, kdy získáme prvotní signál od Feedly a tuto znalost dále rozšíříme ve vědecké publikaci. Důležité je všímat si slabých signálů a ty se snažit dát do kontextu – to poskytne výhodou nad konkurencí.

Příkladem může být, když se firma bude snažit expanzovat svou působnost do jiného odvětví, ale nějak na to nepospíchá. Definuje pravidla pro Feedly a může se věnovat své hlavní činnosti na místo toho, aby se pročítala články z různých zdrojů. Výhodou je také sdílení jednotlivých článků napříč týmem, který může být sestaven z různých divizí podniku a tam, kde někdo nevidí signál, ho druhý vidět může. Články je možné sdílet s konkrétními členy a umožňuje i anotování. Před začátkem projektu je potřeba udělat důkladnou rešerši a k tomu nám také dopomůže právě Feedly, které už může sbírat informace z daného tématu už nějakou dobu.

Obrázek 6: Sdílení článků se členy týmu a možnost anotovat 15

Důležité je zmínit, že Feedly nenahradí kompletně práci na rešerších, pouze se jedná o nástroj, který má zefektivnit workflow a přinést časovou úsporu. Nabité poznatky je vhodné kombinovat s jinými vědeckými zdroji, které bohužel není možné na Feedly napojit.

Závěr

Feedly je určitě užitečný nástroj, neboť pomáhá agregovat různé informační zdroje na jedno místo. Své uplatnění najde při rešerších, které je ale nutné kombinovat i s dalšími vědeckými knihovnami a deep web zdroji, které bohužel není možné na Feedly napojit. Jeho síla se projeví především v placených plánech, kde je dostupný i Leo Assistant, který protřiďuje články za využití AI a námi stanovených pravidel. Důležité je také přesně specifikovat požadavky na zdroje, témata a klíčová slova, protože pokud tak neučiníme, můžeme dojít i tak k přehlcení informacemi. S ohledem na CI má své využití, neboť se můžeme dostat k informacím dříve, než konkurence a také můžeme sbírat články a zmínky o našem konkurentovi a budeš už na nás, jak s tím naložíme.

Zdroje

  1. The IBM Big Data Platform. Transforming Data with Intelligence https://tdwi.org/whitepapers/2014/04/ibm_the-ibm-big-data-platform.aspx
  2. The 11 types of sources you can add on Feedly.
    Feedly Blog https://blog.feedly.com/the-11-types-of-sources-you-can-add-to-feedly/.
  3. Meet Leo, Your AI Research Assistant.
    Feedly Blog https://blog.feedly.com/leo/.
  4. Feedly – Goodbye information overload.
    Feedly https://feedly.com.
  5. Leo and Topics.
    Feedly Blog https://blog.feedly.com/leo-and-topics/.
  6. Introduction to Leo 0.5.
    Feedly Blog https://blog.feedly.com/introduction-to-leo-0-5/.
  7. Leo understands funding events, product launches, and partnership announcements.
    Feedly Blog https://blog.feedly.com/leo-understands-funding-events-product-launches-and-partnership-announcements/.
  8. Deduplication Skill – Leo.
    Feedly Blog https://blog.feedly.com/deduplication-skill-leo/.
  9. Leo and Mute Filters.
    Feedly Blog https://blog.feedly.com/leo-and-mute-filters/.
  10. Leo and Summarization.
    Feedly Blog https://blog.feedly.com/leo-and-summarization/.
  11. How to Track Google News Keyword Alerts in Feedly.
    Feedly Blog https://blog.feedly.com/follow-google-news/.
  12. How to add RSS feeds for Medium?
    https://feedly.helpscoutdocs.com/article/351-how-to-add-rss-feeds-for-medium
  13. Get tweets in Feedly.
    Feedly Blog https://blog.feedly.com/get-tweets-in-feedly/.
  14. Get newsletters in Feedly.
    Feedly Blog https://blog.feedly.com/get-newsletters-in-feedly/.
  15. Share insights with your team.
    Feedly Blog https://blog.feedly.com/how-to-get-the-most-out-of-feedly-with-your-team/.

Open Data Network: solidní rozcestník otevřených dat

0
ODN-title

Nástroj Open Data Network (zkr. ODN) slouží jako vyhledávač otevřených dat. Konkrétně se zaměřuje na oblast vládních dat v rámci USA na úroveň jednotlivých okresů a umožňuje vyhledávat různé volně dostupné informace z jednotlivých kategorií. Využitelný je tedy jak pro širokou veřejnost, tak pro výzkumníky, soukromé společnosti apod. Zároveň nabízí software pro organizace/státní orgány, které tato data vydávají a umožňují jim pomocí distribuovaného prostředí jejich data sdílet a analyzovat. Cílem Open Data Network je tedy umožnit plošnou distribuci těchto dat na jednom místě. A jelikož se jedná o otevřená data (open data), data jsou volně použitelná jak pro vlastní, tak komerční účely. [1]

Software vytvořila společnost Socrata v r. 2014, kterou odkoupila společnost Tyler Technologies v r. 2018. [2]

Struktura a vyhledávání

Jak již bylo zmíněno, nástroj slouží k vyhledávání otevřených dat. K tomu využívá aplikační rozhraní REST API a pro správu používá program Apiary (zkr. ODN API).  

Kategorie dat

Mezi hlavní kategorie, které ODN nabízí, patří:

  • finance
  • infrastruktura
  • životní prostředí
  • doprava
  • veřejná bezpečnost
  • demografie
  • ekonomika
  • vzdělání
  • zdraví
  • bydlení a rozvoj
  • sociální služby
  • rekreace/zábava
  • politika

Tyto data dále dělí dle jednotlivých států a jejich okresů. Podobně jako ostatní informační nástroje, i ODN umožnuje vyhledávání pro více i méně zkušené uživatele pomocí uživatelského rozhraní.

Možnosti vyhledávání

Webové stránky vyhledávače mají velmi jednoduchý a přehledný design, který pro základní (přímé) vyhledávání dokáže využít i nezkušený uživatel. Na hlavní stránce je vyhledávací okno, které zobrazuje nápovědu k možnému vyhledávání. Dále jsou zde zobrazeny kategorie dat a jednotlivé státy, ve kterých je možné data hledat.

ODN - vyhledávací poleObr. 1 – vyhledávací pole ODN, zdroj: autor

Přímé vyhledávání

Vyhledávací dotaz je možné zadat jak formou otázky, tak pomocí klíčových slov. Na obrázku níže (viz Obr. 2) je vidět výsledek vyhledávání „The median female earnings of Kings County, NY“ (medián příjmů žen z Kings County v New Yorku). Kromě samotné informace, tedy konkrétní hodnoty, je vidět i mnoho dalších relevantních informací, jako např. porovnání s mediánem u mužů a obecným mediánem, geografickým rozdělením aj. Vždy záleží na povaze dotazu, jaké další možnosti nástroj zobrazí.

ODN - okno výsledku vyhledávání

Obr. 2 – okno výsledku vyhledávání, zdroj: autor

V levé části je nabídka dalších podobných otázek a případné doplnění/změny lokality dotazu (stát/okres). V horním menu je pak možné dále přepínat mezi kategoriemi dat v rámci dané oblasti včetně možnosti filtrování. To opět závisí na dané kategorii a dostupnosti dat. Resp. zobrazují se jiné filtry u ekonomických dat než u dat ze zdravotnictví.

V dolní části obrazovky jsou zobrazené datasety relevantní s daným dotazem. U každé z nich je vidět název, zdroj, popis a datum poslední úpravy. Při rozkliknutí je možné dohledat další podrobné informaci včetně konkrétního původu dat.

Pokročilejší vyhledávání

Co se týče pokročilejšího/konkrétnějšího vyhledávání, aplikace jej umožňuje přes již zmíněné rozhraní ODN API. Tento způsob přístupu má velmi široké využití ve vlastních aplikacích, kde pomocí rozhraní HTTP snadno získat potřebná data ve formátu JSON.

Pro nezkušeného uživatele je tvorba dotazu poměrně složitá a vyžaduje určitou znalost REST API, HTTP a formátu JSON. ODN API ovšem nabízí přehlednou nápovědu a příklady užití. Skupiny příkazů dělí na:

  • suggestions
  • search datasets
  • search questions
  • entity lookup
  • entity relationships
  • data availability
  • data constraints
  • data values
  • map creation

Při zpracování se používá fulltextové vyhledávání, takže při správné syntaxi by dotaz měl vždy vrátit výsledek bez ohledu na fakt, zda informaci nalezl či nikoliv (výsledek ve smyslu úspěšného HTTP dotazu).

Pokud bychom chtěli replikovat dotaz z přímého vyhledávání (medián výdělku žen), tak bychom využili příkaz „question“, resp. vyhledání otázky, a syntaxe dotazu bude vypadat následovně:

http://api.opendatanetwork.com/search/v1/question?query=The%20median%20female%20earnings%20of%20Kings%20County%2C%20NY

Aplikace nám vrátí odpověď, v jejímž těle (angl. response body) bude následující JSON:

ODN - ukázka výstupu v JSON kódu

Obr. 3 – ukázka výstupu v JSON kódu, zdroj: autor

Pod každým příkazem je zobrazena ukázka, jak správně nastavit připojení k ODN API pro různé programovací jazyky (Javascript, C#, Python, PHP aj.), což může být velmi užitečné právě pro méně zkušené uživatele, kteří si chtějí propojit vlastní řešení s ODN API. [3]

ukázka PHP kódu k připojení ODN API

Obr. 4 – ukázka PHP kódu k připojení ODN API, zdroj: autor

Příklady užití

V prvním příkladu pomocí přímého vyhledávání zkusíme dohledat data o úspěšnosti dokončení vysoké školy ve státě New York. Na úvodní stránce do vyhledávače zadáme „college graduation rate NY“. V tomto konkrétním příkladu našel nástroj více konkrétních otázek, a proto nám zobrazil nabídku možností, kterou nejvíce definuje náš dotaz. Pokud by ani jedna nevyhovovala našemu zadání, je možné prohledávat mezi jednotlivými datasety zobrazenými pod nabídkou. Vybereme „What is the college graduation rate of New York, NY?“.

výsledek vyhledávání (příklad 1)

Obr. 5 – výsledek vyhledávání (příklad 1), zdroj: autor

V horní části okna je zobrazen výsledek – úspěšnost je 37,4 % v r. 2018. Ve filtrech můžeme dále vybírat dostupné období a případně zvolit podobné otázky (např. úspěšnost absolvování střední školy). Všechny tyto data jsou ale již zobrazeny v tabulce níže. Dále je zde vidět mapa, které ovšem z důvodu chybějících dat nebo technické závadě v době zkoušení nezobrazovala výsledky.  Podobně jako na předchozí stránce jsou pak vidět konkrétní datasety týkající se tématu úspěšnosti absolvování škol v New Yorku.

Pro druhý příklad použijeme ODN API a konkrétně chceme zjistit počet obyvatel ve státě Washington. Pro získání dat (příkaz data) nejdříve potřebujeme zjistit „entity_id“, resp. kód státu Washington. Ten zjistíme pomocí příkazu entity:

http://api.opendatanetwork.com/entity/v1?entity_name=washington

Tento dotaz nám vrátí velké množství výsledků od jednotlivých okresů až po konkrétní body na mapě. Proto dotaz více specifikujeme přidáním typu entity (typy entit jsou uvedené v dokumentaci ODN API):

http://api.opendatanetwork.com/entity/v1?entity_name=washington&entity_type=region.state

Tím dostaneme požadovaný výsledek v JSON a identifikátor státu Washington.

{  
 "entities": [    
     {      
        "id": "0400000US53",      
        "name": "Washington",      
        "type": "region.state"    
      }  
 ]
}

Nyní už můžeme vyhledat konkrétní data o populaci přes příkaz data:

http://api.opendatanetwork.com/data/v1/values?variable=demographics.population.count&entity_id=0400000US53

Opět nám nástroj vrátí data ve formátu JSON[1]:

{
"data": [
   [
     "year",
     "0400000US53"
   ],
   [
     2009,
     6465755
   ],
   [
     2010,
     6561297
    ],

Další zpracování dat už je na uživateli. Jak již bylo řečeno, využití ODN API je vhodné pro zkušenější uživatele, kterým nestačí pouze zobrazení přes ODN, ale potřebují otevřená data ve vlastním rozhraní/aplikaci.

[1] Seznam ve formátu JSON není uveden celý.

Shrnutí

Cílem této práce bylo představit nástroj Open Data Network a jeho možnosti pro vyhledávání dat. Jedná se o velmi dobře zpracovaný program, který umožňuje sofistikované využití otevřených dat pro vlastní použití. Jedinou značnou nevýhodou je omezení na vládní data pouze v rámci USA.

Použitá literatura

[1] SOCRATA. What Is the Open Data Network? [online]. 2015 [vid. 2021-02-10]. Dostupné z: https://www.youtube.com/watch?v=FvcFW6DhRHQ&ab_channel=Socrata

[2] LERMAN, Rachel. Seattle tech company Socrata bought by Tyler Technologies. The Seattle Times [online]. 18. duben 2018 [vid. 2021-02-10]. Dostupné z: https://www.seattletimes.com/business/technology/seattle-tech-company-socrata-bought-by-tyler-technologies/

[3] SOCRATA. ODN API · Apiary. ODN API [online]. 2021 [vid. 2021-02-10]. Dostupné z: https://odn.docs.apiary.io/#reference/0/suggestions

 

SocialBearing.com nabízí vhled do příspěvků a uživatelů fenoménu dnešní doby – Twitteru

0

Úvod

Žijeme v době internetu. Komunikace mezi lidmi a přenos informací v rámci jednotlivých skupin či celé společnosti se neustále zrychluje a dosud nikdy nebyl snažší. Pro přenos informací a názorů lidí existuje mnoho kanálů. Zásadním nástrojem pro tuto činnost jsou sociální sítě. V našem okolí asi málokdo nemá účet na žádné sociální síti. Na nich jsou denně publikovány miliony a možná spíše miliardy příspěvků. Většina z těchto příspěvků se obvykle stává „mrtvými“ po uplynutí určité doby. U některých je to pár hodin, u některých den, výjimečně i více dní. Příspěvek a informace je předána a dále už se o ni tolik lidí nezajímá, protože již není prostě úplně nová a přebijí ji novější příspěvky a informace. Co když ale budeme chtít zpětně v příspěvcích bádat nebo dokonce příspěvky s určitými znaky agregovat a dělat nad nimi různé analýzy? O nástroji SocialBearing, který to umožňuje v rámci sítě Twitter, si povíme více v následujících kapitolách.

O nástroji

Vznik samotného nástroje se datuje do roku 2014. Autor uvádí, že při jeho tvorbě nevěděl, jaké cílové skupině nebo skupinám bude vlastně nástroj určen. Jeho primárním cílem bylo vytvořit „open search“ statistický nástroj pro kohokoli, kdo by se zajímalo o širší vhled do zajímavých tweetů, lidí, statistik nebo sentimenty o kterémkoli subjektu. Autor jmenuje 9 účelů vyhledávání, pro který je primárně možné nástroj využít.

  • Analýza zmínek vaší značky nebo businessu
  • Nejlepší tweety o vašem webu nebo článku
  • Populární hashtagy, trendy nebo konverzace
  • Nejvíce poutavé tweety obsahující obrázky či odkazy
  • Zajímavá fakta a vhledy do vašich přátel a sledujících
  • Zajímavé účty ke sledování
  • Účty k ukončení sledování
  • Analýza vlastní timeline
  • Tweety s geolokačními prvky

Základní předpoklady a omezení

Pro používání nástroje je zapotřebí být přihlášen na Twitteru a autorizovat aplikaci k jeho využívání. API omezuje počet možných requestů za určitou dobu. V případě prohledávání uživatelských timeline je omezení na 180 requestů každých 15 minut a pro vyhledávání zmínek omezení činí 15 requestů na 15 minut. Vyhledávání probíhá tzv. „on demand“, čili v závislosti na aktuálním stavu tweetů a indexace a poskytuje výsledky založené na vyhledávání zmínek až 7 dní zpětně. V případě prohledávání uživatelských timeline může zobrazit až 3200 nejnovějších tweetů. Neprobíhá žádná archivace výsledků. S premium účtem je možné některá výše uvedená omezení odbourat a stejně tak získat nové funkcionality např. v rámci pokročilého filtrování výsledků.

Ne všechny tweety je však možné nástrojem nalézt a zahrnout do analýzy. Tweety od určitých uživatelů, kteří jsou méně aktivní, jsou také méně indexovány. Čili indexovány jsou prioritně tweety od aktivních uživatelů s většími počty sledujících. Stejně tak nejsou do analýz zahrnout tweety uživatelů, kteří mají chráněný (soukromý, zamčený) profil a jejich tweety nejsou veřejně dostupné komukoli. Stejně tak nebudou zahrnuty tweety, které byly z důvodu jejich vysoké citlivosti zablokovány. Nicméně u většiny citlivých tweetů Twitter poskytuje tzv. flag „possible sensitive content“, přes kterou je možné výsledky vyhledávání filtrovat.

Autor zdrůrazňuje, že sentiment skóre vyhledávaných tweetů není vždy přesné a že s použitím „natural language detection“ se budou vždy ve výsledcích vyskytovat tzv. „false positive“ výsledky. Zdůrazňuje také, že např. sarkasmus a ironie je obvykle velmi složité algoritmicky detekovat.

Nástroj vyhodnocuje pro každý tweet sentiment skóre takovým způsobem, že každé slovo ve tweetu je porovnáno se souborem pozitivních a negativních slov. Sentiment skóre pro každé slovo je pak přidáno k ostatním a je vytvořeno souhrnné sentiment skóre samotného tweetu.

Geolokace a soukromí uživatelů Twitter

Autor uvádí, že pro geolokační analýzy náhodně upravuje koordináty uložené v geolokační značce tweetu a to tak, že značka je posunuta libovolným směrem do vzdálenosti zhruba o velikosti fotbalového hřiště, což k neprozrazení přesné adresy uživatele zřejmě postačuje a zároveň jsme ještě pořád schopni tweety na základě geolokace efektivně shlukovat např. na základě konání nějaké hromadné akce. Během analýzy v roce 2016 bylo zjištěno, že zhruba 65% uživatelů umožňuje Twitteru ukládat geolokační data.

Použití nástroje

Po příchodu na hlavní stránku nástroje nám je nabídnuto především pole pro zadání našeho dotazu s tím, že je nabízeno 6 různých druhů vyhledávání:

  • Tweets – prohledává tweety
  • Timelines – analyzuje příspěvky konkrétního uživatele
  • Geo – analyzuje klíčové slovo ve tweetech s geolokačními daty v určitém rádiusu od zadaného bodu
  • People – vyhledává lidi, kteří jsou nejrelevantnější zadanému dotazu
  • Followers – analyzuje sledující konkrétního zadaného uživatele
  • Friends – analyzuje účty, které zadaný uživatel sleduje

U některých způsobů je také umožněno rozšířené nastavení:

  • Tweets – přesná shoda, omezení na fotky/odkazy/video/ověřené, typ, ID
  • Geo – radius vyhledávání od zadaného bodu
Obrázek 1: Úvodní obrazovka – vyhledávací pole, druhy vyhledávání, rozšířené nastavení [Zdroj: autor]

Pro vyzkoušení vyhledávání použijeme vyhledávání ve tweetech. Slova se zadávají v libovolném počtu a oddělují se mezerou. V takovém případě se zřejmě jedná o „OR“ vyhledávání. V případě zaškrtnutí možnosti „Exact match“ se zřejmě jedná o „AND“ vyhledávání. Využijeme aktuální politické situace ve Spojených státech amerických a zadáme vyhledávání s těmito parametry:

  • Hledané slovní spojení: Trump
  • Type: Popular

Po stisknutí vyhledávacího tlačítka se během pár sekund zobrazí výsledky. Zobrazí se 100 nejnovějších tweetů. Pod tímto číslem je tlačítko „Load more“, které umožňuje zhruba po stovkách načítat další tweety a promítnout je do analýzy.

Obrázek 2: Výsledky vyhledávání [Zdroj: autor]

Nechal jsem načíst zhruba 1000 nejnovějších tweetů. Dle dalšího čísla “Timeframe” se dozvídám, že se jedná o vhled za dobu pouhých 3 minut s dosahem téměř 4 mil., což mě osobně poměrně šokuje. Kromě toho mě zaujme analýza sentiment, kde se dozvídám, že z analyzovaných tweetů bylo pouze zhruba 15% pozitivního charakteru (“Great” nebo “Good) a přes 55 % negativního charakteru (“Terrible” a “Bad”). Dále vidím, že téměř 80% příspěvků jsou tzv. Retweety, což je sdílení původního příspěvku a pouhých zhruba 8% jsou nově napsané tweety. Další vhledy poskytují statistiky jako jsou druh přístupu (iPhone, Android, Web…) nebo jazyk tweetů.

Obrázek 3: Hashtag & word cloud, tweets by country [Zdroj: autor]

Pokud se posunu na stránce o kousek dolů, mohu vidět zajímavý vhled do hashtagů a slov, které se prolínají analyzovanými tweety. Opět je vidět, že to odráží aktuální politickou situaci ve Spojených státech, kdy se v tzv. Hashtag I word cloudu vyskytují slova jako “impeachment” či “guilty”. Lze však nalézt i jiné faktické znaky jako “republicans” či “America”.

Je mi také nabídnuta analýza geolokačních dat a abych se pro ni rozhodl, tak mi nástroj napoví, že 64% uživatelů, kteří analyzované tweety publikovali, měli zapnutou geolokaci. To ukáže, že největší část tweetů pochází logicky ze Spojených států, ale i z dalších zemí Evropy či Asie.

Obrázek 4: Procházení analyzovaných tweetů [Zdroj: autor]

Když půjdu po stránce ještě níže, tak se mi postupně zobrazují jednotlivé analyzované tweety s příslušnými statistikami, kterými se můžu probírat. Mohu je různě filtrovat, řadit, či načítat nové. Jsou v nich zvýrazněna slova použita k analýze sentimentu.

V levé části obrazovky se vyskytují filtry, které se dají aplikovat na celý set nalezených výsledků. Mezi ně patří například:

  • Druh – plain tweets, retweets, replies, pictures, videos….
  • Sentiment – great, good, neutral, bad, terrible
  • Jazyk
  • Statistiky tweetů – dosah, počet sledujících
  • Ostatní – duplikáty apod.

Dále je možné filtrovat příspěvky dle nejlepších přispěvatelů ať už z pohledu jejich aktivity k danému tématu, nebo obecného dosahu příspěvku uživatelů. Možná je i filtrace přes hashtagy, slova, zmínky profilů, domény odkazů aj. Těch možností je skutečně mnoho.

Teoreticky bych si tedy mohl upravit vyhledávání tak, abych měl vhled do tweetů na příslušné téma od známějších osobností (většinou politiků) z Evropy.

Podobné statistiky a filtrace umožňují i ostatní druhy vyhledávání z nichž se mi nejvíce líbilo vyhledávání lidí na základě zadaného slova. Lze tak nalézt zajímavé účty ke sledování o kterých byste jinak třeba ani nevěděli a sledovat skutečně to, o co má daný člověk zájem. Pro společnosti a osobnosti s velkým počtem uživatelů může být zajímavý vhled do vlastních followerů a zjistit tak třeba, kdo je hlavním odběratelem jejich informací na twitteru a na základě takového vhledu rozvíjet určité kampaně.

Licence

Nástroj je možné využívat zdarma s určitými omezeními. Pro neomezené využití a ještě pokročilejší funkce je zapotřebí vlastnit premium účet. Data jsou získávána prostřednictvím API přímo z twitteru a nejsou nijak omezena na způsobu jejich využití a jsou mj. veřejně dostupná. Aplikace pouze přináší velmi rychlý způsob, jak je zpracovat a agregovat.

Závěr

Aplikace má z mého pohledu určitě široké spektrum potenciálních uživatelů. Bude se hodit ať už společnostem, které mohou na základě těchto dat upravovat své twitterové jednání a třeba i tvořit prodejní kampaně. Stejně tak aplikaci využijí známé osobnosti a influenceři, kteří chtějí získat povědomí o tom, kdo je vlastně jejich primárním konzumentem na Twitteru. Dále je možné nástroj využít např. při různých analýzách určité aktuálně nastalé politické či jiné situace k analýze názorů lidí. A pokud nemá někdo zájem o takové komplexnější analýzy a kroky, tak si minimálně může na základě svých zájmů najít nové účty ke sledování.

Zdroje

Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing. Twitter Analytics for Tweets, Timelines & Twitter Maps | Social Bearing [online]. Copyright © 2021 [cit. 11.02.2021]. Dostupné z: https://socialbearing.com/

Seznam obrázků

Obrázek 1: Úvodní obrazovka – vyhledávací pole, druhy vyhledávání, rozšířené nastavení [Zdroj: autor]

Obrázek 2: Výsledky vyhledávání [Zdroj: autor]

Obrázek 3: Hashtag & word cloud, tweets by country [Zdroj: autor]

Obrázek 4: Procházení analyzovaných tweetů [Zdroj: autor]

O DuckDuckGo a proč jej využívat

0




Pokud se zajímáte o ochranu vašeho soukromí na internetu, nejspíš jste již o DuckDuckGo slyšeli. DuckDuckGo je webový vyhledávač, který chrání soukromí svých uživatelů. Z tohoto důvodu je považován za bezpečnější alternativu k oblíbenému Google vyhledávači. Pokud stále využíváte Google vyhledávač, podíváme se na to, proč vlastně lidé vyhledávají alternativy.

Google (stejně jako Yahoo nebo Bing) o uživatelích zachycuje hodně informací, aby jim mohl nabízet personalizované výsledky a také samozřejmě personalizované reklamy. DuckDuckGo na rozdíl od Googlu nijak neprofituje prodáváním informacích o svých uživatelích. [1]

Co o mně ví Google?

Podle vašeho vyhledávání o vás ví třeba kolik vám je let, zda máte děti, v jakém oboru pracujete, jaké je vaše vzdělání nebo třeba jak je velká firma, ve které pracujete. Někdy také vyhledáváte informace týkající se vašeho zdravotního stavu nebo financí. Google vlastní mimo jiné také YouTube, takže ví i jaká videa vyhledáváte. Tyto informace můžete lehce získat ve správě svého Google účtu. [2]

Informace, které o mně má Google

Zdroj: Nastavení soukromí na www.Google.com

Problémem Google je, že kolem svého uživatele vytváří tzv. „Filter Bubble“. Místo nezaujatých výsledků vyhledávání zobrazuje výsledky, u kterých je větší pravděpodobnost, že na ně uživatel klikne, na základě toho, co v minulosti vyhledával a prohlížel. „Filter Bubble“ může být nebezpečná, protože neukazuje uživateli celou pravdu, ale pouze to, co by se mu mohlo líbit. [2]

Alternativu nabízí právě vyhledávač DuckDuckGo.

Vzhled DuckDuckGo

Zdroj: úvodní strana www.DuckDuckGo.com

Vyhledávač DuckDuckGo byl založen v roce 2008 a od té doby nabírá na popularitě. Aktuálně láme rekordy – za den zde uživatelé provedou okolo 100 milionů vyhledávání. Pro srovnání, na Google proběhne za jeden den přibližně 3,5 bilionů vyhledávání. [3] [4]

Počty vyhledávání na DuckDuckGo 2010-2019

Zdroj: https://searchengineland.com/duckduckgo-broke-9-billion-searches-in-2018-and-its-growing-310002

DuckDuckGo nevytváří profil svých uživatelů a brání tak vzniku „Filter Bubble“, znamená to tedy, že výsledky vyhledávání jsou pro všechny stejné, bez ohledu na to, zda danou věc uživatel v minulosti vyhledával. [5]

Jak DuckDuckGo vydělává?

Vyhledávač vydělává, stejně jako Google, zobrazováním reklamy mezi výsledky vyhledávání. Reklamy nejsou ale tolik personalizované. Reklama je zobrazována pouze na základě vyhledávaných klíčových slov. Společnost také vydělává svým partnerstvím s obchodními platformami Amazon a EBay. Pokud uživatel uskuteční nákup na některé ze stránek a na stránku přešel z výsledku vyhledávání na DuckDuckGo, náleží vyhledávači odměna. [6] [7]

Soukromí při vyhledávání

Search leakage

Další problematickou oblastí ve vyhledávání, se kterou DuckDuckGo bojuje, je tzv. „search leakage“ neboli únik vyhledávaných informací. Pokud uživatel něco vyhledává v běžných vyhledávačích a následně klikne na nějaký z odkazů ve výsledcích vyhledávání, je automaticky sdílen obsah tohoto jeho vyhledávání s webem, na který klikl. Zároveň je se všemi weby sdílen „user agent“ a IP adresa uživatele. Díky této kombinaci weby nebo e-shopy ví, co zákazník vyhledával, jak se dostal na jejich web a také, kdo tento zákazník je. DuckDuckGo předává informace webům, které uživatel z vyhledávání navštíví, v takové podobě, že není možné zjistit, co za vyhledávání předcházelo. [8]

Historie vyhledávání

Běžné vyhledávače ukládají historii vyhledávání uživatele spolu s datem a časem vyhledávání a často také s údaji o uživateli. Tato kombinace může být opět nebezpečná, jelikož dohromady dává o uživateli poměrně soukromé informace. DuckDuckGo historii vyhledávání nikdy neukládá. [8]

Sběr informací

Vyhledávače běžně sbírají veškeré informace o vyhledávání, včetně toho, kdo jej vyhledával. Data jsou velmi ceněná a vyhledávače často automaticky tato data sbírají, i když předem neví, na co je použijí. DuckDuckGo neukládá o uživatelích žádné takové informace. [8]

Informace, kterou DuckDuckGo má o uživatelích, je například, jaké !bangs nejčastěji používá. (Více o použití !bangs je v části o pokročilém vyhledávání). DuckDuckGo také ukládá vyhledávání, aby mohl zlepšovat kvalitu vyhledávače, ovšem vše, co ukládá je anonymní a není nijak napojené na uživatele. [8]

Použití

Hlavní stránka vyhledávače

Zdroj: hlavní stránka www.DuckDuckGo.com

Vyhledávání je velmi intuitivní a grafické rozhraní se podobá ostatním vyhledávačům.

Vyhledávání

Zdroj: www.DuckDuckGo.com

Vyhledávač samozřejmě nabízí i vyhledávání obrázků.

Vyhledávání obrázků v DuckDuckGo

Zdroj: obrázky ve vyhledávači www.DuckDuckGo.com

Vyhledávač nabízí také mapy a plánování tras. Využívá Apple mapy, které nabízí více soukromí než Google mapy.

Vyhledávání v mapách

Zdroj: mapy ve vyhledávači www.DuckDuckGo.com

Vyhledávač zobrazuje také recenze, pokud uživatel vyhledává např. restaurace. Recenze jsou z webu Tripadvisor.com

Vyhledávání podniků/restaurací

Zdroj: vyhledávání na www.DuckDuckGo.com

Vyhledávač nabízí také mobilní aplikaci pro Android i IOS.

Mobilní aplikace DuckDuckGo

Zdroj: mobilní aplikace DuckDuckGo

Pokročilé vyhledávání

Vyhledávání se dá zjednodušit a zrychlit pomocí pokročilého vyhledávání. DuckDuckGo nabízí několik vychytávek, jak hledání upřesnit.

Vyhledávací operátory

PříkladVýsledek
Psi a kočkyVýsledky obsahující psi a kočky
„Psi a kočky“Výsledky obsahující přesný pojem „psi a kočky“
Psi -kočkyMéně koček ve výsledcích
Psi +kočkyVíce koček ve výsledcích
Kočky filetype:pdfPDF soubory o kočkách
Kočky site:Instagram.comVýsledky s kočkami z webu Instagram.com
Kočky -site:Instagram.comVýsledky s kočkami kromě těch z webu Instagram
intitle:kočkyTitulek stránky obsahuje „kočky“
inurl:kočkyURL stránky obsahuje „kočky“

Zdroj: https://help.duckduckgo.com/duckduckgo-help-pages/results/syntax/, vlastní překlad

Operátory pro přímé přesměrování na další weby

\Přesměrování přímo na první web z výsledků vyhledávání
!Přesměrování do vyhledávání přímo na stránku např. !a = přesměrování na Amazon, !r = Reddit, !w = Wikipedia

Zdroj: https://help.duckduckgo.com/duckduckgo-help-pages/results/syntax/, https://duckduckgo.com/bang, vlastní překlad

Instant answers

Pokud se k vyhledávání přidá „zprávy“ nebo „news“ vyhledávač vyhledá zprávy. Vyhledávač nabízí také řadu „instant answers“ například různé cheatsheety (pro účetnictví, programování a další). (9)

Vychytávky

DuckDuckGo má také několik užitečných funkcí.

Stopky

Zdroj: vyhledávání „stopwatch“ na www.DuckDuckGo.com

Definice

Zdroj: vyhledávání ,,empathy“ na www.DuckDuckGo.com

Závěr

Vyhledávač DuckDuckGo je příjemnou alternativou k běžnému Google vyhledávači. Jeho použití je intuitivní a jednoduché, nabízí mnohem lepší soukromí než klasické vyhledávače a pro uživatele, kteří si potrpí na soukromí na internetu a nechtějí svá data zadarmo (a často bez vlastního vědomí) předávat velkému množství navštívených a vyhledávaných webových stránek, je DuckDuckGo určitě skvělá volba. Mobilní aplikace je také intuitivní, jednoduchá a příjemná na použití. Nevýhodu vidím například v absenci Google recenzí, které přece jen zahrnují více podniků a mají více recenzí ne Tripadvisor. Také není DuckDuckGo tolik přátelský k češtině – některé funkce umí jen anglicky. DuckDuckGo je ale čím dál víc oblíbený (a není se čemu divit) a věřím, že brzy bude moct Google vyhledávači plně konkurovat.

Zdroje

[1] Eyerys.com Search Engine And Privacy By Gabriel Weinberg [online]. [cit. 9.2.2021]. Dostupné z: https://www.eyerys.com/articles/people/search-engine-and-privacy-gabriel-weinberg

[2] Spreadprivacy.com Why use DuckDuckGo instead of Google [online]. [cit. 9.2.2021]. Dostupné z: https://spreadprivacy.com/why-use-duckduckgo-instead-of-google/

[3] Eu.usatoday.com Search engine DuckDuckGo increases traffic [online]. [cit. 9.2.2021]. Dostupné z: https://eu.usatoday.com/story/tech/2021/01/18/search-engine-duckduckgo-increases-traffic-google-competitor/4202556001/

[4] Ardorseo.com 11 search statistics you need to know in 2021 [online]. [cit. 9.2.2021]. Dostupné z: https://ardorseo.com/blog/how-many-google-searches-per-day/

[5] Searchengineland.com DuckDuckGo broke 9 bilion searches in 2018 and it’s growing [online]. [cit. 9.2.2021]. Dostupné z: https://searchengineland.com/duckduckgo-broke-9-billion-searches-in-2018-and-its-growing-310002

[6] Busienss insider What is DuckDuckGo [online]. [cit. 9.2.2021]. Dostupné z: https://www.businessinsider.com/what-is-duckduckgo

[7] Echo24.cz DuckDuckGo vs. Google. Jak si vede privátní vyhledávač v roce 2019 [online]. [cit. 9.2.2021]. Dostupné z: https://m.echo24.cz/a/SisfQ/duckduckgo-vs-google-jak-si-vede-privatni-vyhledavac-v-roce-2019

[8] DuckDuckGo.com Privacy [online]. [cit. 9.2.2021]. Dostupné z: https://duckduckgo.com/privacy

[9] DuckDuckGo.com DuckDuckGo help pages [online]. [cit. 9.2.2021]. Dostupné z: https://help.duckduckgo.com/duckduckgo-help-pages/results/syntax/

[10] Quora.com What is the revenue generation model for DuckDuckGo [online]. [cit. 9.2.2021]. Dostupné z: https://www.quora.com/What-is-the-revenue-generation-model-for-DuckDuckGo/answer/Gabriel-Weinberg

[11] DuckDuckGo.com Bang [online]. [cit. 9.2.2021]. Dostupné z: https://duckduckgo.com/bang

[12] DuckDuckGo.com

ThinkWithGoogle: Nástroje, studie pro vaše podnikání

0

 

Thinkwithgoogle

 

Thinkwithgoogle je reportingový mechanizmus najväčšieho internetového giganta a to spoločnosti Google. Prostredníctvom pevných údajov poskytuje prehľad o rôznych kanáloch a  skúma budúce trendy. Ako vysvetľuje sám Google: „ V dnešnom digitálnom svete sa marketingový priemysel pohybuje rýchlejšie ako kedykoľvek predtým. V spoločnosti „Think With Google“ spájame rovnako zmýšľajúcich marketingových pracovníkov, aby sme držali krok s tým, čo je nové a čo ďalej v oblasti digitálnych médií a marketingu.“

Predplatitelia dostávajú najnovšie novinky z odvetvia, najlepšie digitálne postupy, prieskum trhu, myšlienky a predpovede o budúcnosti. Stránka predstavuje „mikromomenty“, spotrebiteľské správanie, video a mobilné dáta pre rôzne témy ako napr.: reklama, spotrebný tovar, meranie, nakupovanie, vyhľadávanie, maloobchod, šport, zábava a cestovanie. [1]

 

Obr.1 Úvodná stránka Thinkwithgoogle. [2]

 

Ponuka služieb Thinkwithgoogle

Obr.2 Ponuka rôznych služieb poskytovaných platformou Thinkwithgoogle. [2]

 

Consumer Insights

Pomocou „Consumer Insights“ môžeme dostať informácie o spotrebiteľskom výskume, nákupnom správaní prostredníctvom údajov v reálnom čase. Toto umožňuje pre používateľov strategické rozhodovanie v prípade správne určených marketingových kampaní.


Tu môžeme nájsť práve rôzne články alebo videá, ktoré sa venujú rôznorodým témam či už o tom ako mení Covid-19 mení trendy o potrebách spotrebiteľov, alebo o tom čo spotrebitelia hľadajú predtým ako sa v USA začína jeden z najväčších obchodných „sviatkov“ a to „Black Friday“ a „Cyber Monday“. Je tu mnoho údajov o tom, ako a čo rôzny spotrebitelia vyhľadávajú a čo ich zaujíma.

Obr.3 Rôznorodé témy v kategórií spotrebiteľských trendov. [2]

 

 

Marketing Strategies

 

V tejto kategórií sa nachádza celkovo 7 podkategórií a to:

  • Advertising Solutions Center
  • App & Mobile
  • Data & Measurement
  • Programmatic
  • Retail
  • Search
  • YouTube

Advertising Solutions Center slúži na prispôsobenie stratégie pre držanie kroku so zákazníkmi. Google ponúka rôzne produkty, štatistiky a odporúčania s ktorými sa dajú dosiahnuť marketingové ciele tej ktorej firmy, alebo jednotlivca. Táto sekcia taktiež ponúka 5 rôznych kategórií podľa toho aký ma byť cieľ marketingu.

Obr. 4 Výber možností na čo ma byť zameraný cieľ marketingu. [2]

 

App & Mobile

nové myslenie v oblasti mobilných technológií a merania.

Bez ohľadu na budúcnosť plánuje každý, kto sa zaoberá marketingom budúcnosť, ktorá bude čoraz digitálnejšia, mobilnejšia a bohatšia na dáta. Na základe spoločného výskumu spoločnosti Google a Ecosultancy najúspešnejší marketingoví pracovníci premýšľajú naprieč platformami (mobilnými aj tradičnými) a na podporu rastu využívajú inteligentnejšie stratégie merania.

Report učil 3 základné atribúty, ktoré zdieľajú optimálni marketingoví pracovníci v tomto svete, ktorý je na prvom mieste v mobilných zariadeniach: [1]

  • Zameriavajú sa na obchodné metriky, na ktorých skutočne záleží, ako sú tržby a zisky, namiesto metrík kampaní, ako sú kliknutia.
  • Využívajú nové nástroje a odhadovanie medzier v meraniach medzi zariadeniami a offline kanálmi.
  • Podporujú experimentovanie, aby našli strategické odpovede na otázky o potencionálnych príležitostiach.

Data & Measurement

Ukazujú ako ľudia vnímajú značku na rôznych platformách. Nachádzajú sa tu články a cenné rady od odborníkov z praxe pre lepšie pochopenie výkonnosti jednotlivých platformových kanálov.

Search

Ukazuje spotrebiteľské zámery podľa toho ako jednotlivý používatelia vyhľadávajú v prehliadači Google. Táto kategória ponúka poznatky a trendy odhalené vyhľadávaním na Google a ako najlepšie využiť marketingové úsilie vo vyhľadávacích nástrojoch.

 

Future Marketing

Tu sa nachádzajú podkategórie pre kreativitu, digitálnu transformáciu, strojové učenie, manažment & kultúra a na koniec súkromie & dôvera.

Budúcnosť marketingu ponúka informácie o tom aké sú najnovšie trendy a technológie v marketingu pretože inovácie prebiehajú rýchlym tempom a nikto nechce zostať v pozadí.

Keďže kreativita je pri marketingu kľúčová a dokáže upútať pozornosť jednotlivca a zároveň ho donútiť konať.

Obr. 5 Články a videá v kategórií kreativita. [2]

 

V kategórií digitálna transformácia nájdeme ako ostatné spoločnosti napredujú v budovaní organizácií, ktoré využívajú najnovšie pokroky a technológie digitálneho marketingu, od automatizácie a strojového učenia až po viac presnejšie dáta a merania.

Obr. 6 jednotlivé články v kategórií digitálnej transformácie. [2]

 

Tools

 

V tejto kategórií sa nachádzajú tieto jednotlivé nástroje:

  • Create with Google
  • Find My Audience
  • Grow My Store
  • Insights Library
  • Market Finder
  • Rising Retail Categories
  • Test My Site

Obr.7 Nástroje v kategórií Create with google. [2]

 

V tejto kategórií sa nachádzajú 4 nástroje, ktoré ponúkajú simulovanú reklamu na Youtube, alebo vytváranie pôsobivých reklám, ktoré sú pripravené na Youtube a to pomocou statických obrázkov, doplnkov a rôznych log. Alebo v kategórií creative downloads, ktorá ponúka široké spektrum nástrojov určených pre Youtube.

Obr.8 nástroje určené pre Youtube v kategórií Create with google. [2]

Find My Audience

Nástroj Find My Audience slúži na porozumie, kto sú najhodnotnejší zákazníci na Youtube, čo ponúka lepšiu možnosť kontaktovania jednotlivých zákazníckych skupín a ich kontaktovanie každého jedného zákazníka správami na mieru.

Tento nástroj ponúka 3 hlavné kroky a to:

  • Identifikovanie publika na základe jeho záujmov, zvykov a toho čo plánujú kúpiť.
  • Stiahnutie profilu, kde je možné získať bezplatný profil publika so štatistikami, ktoré pomôžu informovať o stratégií videoreklám človeka, ktorý chce mať svojou reklamou čo najväčší dosah.
  • Spojenie sa s publikom, ktorý slúži na začatie kampane na platforme Youtube, ktorá osloví ľudí na ktorých je biznis daného jednotlivca orientovaný.

Grow my store

Nám umožňuje zadať url stránky a následne tento nástroj vyhodnotí danú web stránku v obrázku dole som zadal stránku o ktorej je celý tento projekt a to www.thinkwithgoogle.com. Pôvodne so chcel zadať stránku našej školy a to www.vse.cz , ale zdá sa, že české a slovenské stránky zatiaľ nie sú v tomto nástroji žiaľ podporované.

Obr. 9 Vyhodnotenie nástrojom Grow my store. [2]

Samozrejme je tento nástroj určený pre hodnotenie stránok, ktoré sa zaoberajú predajom vecí, alebo služieb a preto nemá zmysel hodnotiť stránku ako je napríklad www.thinkwithgoogle. , ale zaujímalo ma aké výsledky nám tento report poskytne. Tento report je skrátená verzia a pre vytvorenie plného reportu sa treba na stránku registrovať.

Insights library

Ďalší veľmi zaujímavý nástroj je určite Insights library, ktorý ponúka príbehy zamerané na trendy a čo je najviac zaujímavé a má veľkú hodnotu je to, že tieto dáta pochádzajú priamo od spoločnosti Google.

Obr. 10 rôzne trendy ponúkané nástrojom „Insights library“ ako je napríklad to aký bol trend nakupovania počas sviatkov v roku 2020. [2]

 

Test my site

Thinkwithgoogle nám ponúka aj zaujímavý nástroj na testovanie webstránok s názvom „Test My Site“, ktorý hodnotí rýchlosť danej stránky a poprípade nám dá rady ako zlepšiť rýchlosť načítania stránky a rôzne iné odporúčania o tom aby stránka bola čo najviac optimalizovanejšia a ľudia na nej aj nakupovali.

Obr.11 testovanie stránky alza.cz. [2]

 

Je treba poznamenať, že toto testovanie nie je úplne presné kvôli tomu, že tento nástroj testoval to aká je rýchlosť pripojenia z Poľska keďže najbližšia lokácia, ktorá sa dá pre stránku Thinkwithgoogle nastaviť je „Central and Eastern Europe“ a nie je možné nastaviť si danú krajinu pre náš prípad, čo by bola Slovenská alebo česká republika, keďže toto sú hlavný spotrebitelia stránky www.alza.cz    

Ako bolo už vyššie zmienené tento nástroj nám ponúka aj všeobecné rady ako zlepšiť webovú stránku tak aby zákazníci, ktorí na túto stránku prišli sa na ňu vrátili aj nabudúce.

Obr.12 Rada o tom ako urobiť stránku personalizovanejšiu pre lepšiu skúsenosť používateľa. [2]

 

 

Záver

 

Thinkwithgoogle ponúka pestré spektrum cenných rad od skúsených profesionálov z marketingu a cenné nástroje pre každého kto by chcel zlepšiť svoj biznis, či už cielenejšími reklamami, alebo používať rôzne platformy na oslovovanie potencionálnych zákazníkov a taktiež nástroje, ktoré môžu pomôcť vytvoriť lepšiu marketingovú stratégiu aj na základe dát, ktoré ponúka samotná spoločnosť Google. Táto stránka môže byť veľmi cenným a zaujímavým nástrojom pre zlepšenie biznisu a lepšie pochopenie správania jednotlivcov v rôznych situáciách.

 

 

Zdroje

 

[1]. Sunil Bagai, How Think with Google Could Dramatically Enhance Recruitment Marketing [online], dostupné na: https://www.crowdstaffing.com/blog/think-with-google-recruitment-marketing

[2]. Obrázky 1-12 vytvorené zo stránky www.thinkwithgoogle.com zdroj: autor

UNData: bohaté datové zdroje Spojených národů

0

UNdata je internetový volně dostupný vyhledávač, který usnadňuje dostupnost dat z databází, které jsou vlastněny organizací OSN. OSN působí po celém světě a hned v několika odlišných odvětvích, ať už se jedná o řešení globální krize vody nebo prevenci konfliktu mezi státy. I kvůli tomu je na UNdata dostupných mnoho datových řad, např. demografické, environmentální nebo komoditní. Mimo datových řad UNdata odkazuje na domovské stránce také na další data určené pro základní orientaci uživatelů, jedná se o:

  • Specializované databáze (MBS, SDG indicators a UNcomtrade),
  • oblíbené statistické tabulky,
  • statistické profily zemí, oblastí nebo regionů.

UNdata vznikli v rámci projektu „statistika jako veřejné dobro“ v roce 2005 za účelem poskytnout bezplatný přístup k světovým statistikám. (Division, UNdata | about us, 2021)

Základní uživatelské rozhraní, ze kterého návštěvník stránky může dále pokračovat na podrobné informace je jednoduché a přehledné. Obsahuje omezené množství prvků, ve kterých je možné se lehce zorientovat a dohledat tížená data. Celá webová aplikace je v anglickém jazyce a žádný další jazyk není bohužel dostupný.

Obr. 1 Základní rozhraní webové aplikace (Úvodní stránka portálu UNdata)

Rychlá navigace

Jak už bylo zmíněno v předchozí kapitole a je zřejmé z obr. 1 je možné přímo přejít na populární statistické tabulky, statistické profily zemí a specializované databáze, které mají ovšem vlastní domény a jedná se o další databáze poskytované UNSD.

V populárních statistických tabulkách je možné naleznout například témata jako populace (mapuje vývoj populace v letech), kriminalitu, cenové indexy a další. Jednotlivé tabulky je možné získat jako pdf nebo csv.

V rámci jednotlivých pdf tabulek je možné najít rozpad daných indexu na státy a rok.

Obr. 2 Index spotřebitelských cen (UNdata index spotřebitelských cen)

U některých států nejsou zaznamenána data za veškeré roky nebo v rámci obou indexu, jedná se zejména o státy rozvojové (Jemen, Zambie aj.). Pokud uživatel má zájem načíst stažený csv souboru s daty do vybraného analytického nástroje (v tomto případě jupyterlab) neměl by být žádný problém.

Obr. 3 Načtení indexu spotřebitelských cen do jupyterlab

V statistických profilech zemí, oblastí nebo regionů lze naleznout základní přehledy o dané zemi, které se zpravidla člení na:

  • Obecné informace,
  • ekonomické ukazatele,
  • sociální ukazatelé,
  • ukazatele stavu přírody a infrastruktury.

U některých zemí není tento přehled tak podrobný a je vynechán jeden nebo více bodů. V rámci samotného přehledu země lze tyto členění rozložit na podrobnější ukazatele. Některé metriky mají u sebe poznámky viz. „surface area“. Význam těchto poznámek je uveden pod ikonou v právem horním rohu.

Obr. 4 Statistický profil České republiky (UNdata obecné informace o České republice)

Ze specializovaných databází, které patří pod OSN jsou zmíněné tři. Jedná se o:

  • SDG indicators,
  • UN comtrade,
  • MBS.

SDG indicators poskytuje informace o vývoji a postupu v rámci jednotlivých indikátorů pro udržitelný rozvoj (Division, SDG Indicators, 2021). V základní nabídce lze nalézt jednotlivé cíle, skrze které je možné se dostat na podcíle a indikátory daných podcílů. Po vybrání indikátoru lze výběr zúžit na určitou geografickou část nebo vymezit jen určité časové období. Zobrazení dat je formě tabulky, kterou je možné stáhnout jako excel soubor.

UN comtrade je největším uložištěm údajů o mezinárodním obchodu. Obsahuje statistiky o mezinárodním obchodě dle typu komodit, služeb a partnerských zemí (STATISTICS, 2021). UN comtrade poskytuje mimo možnosti stažení dat i možnost rovnou si data vizualizovat.

MBS nabízí aktuální ekonomické a sociální statistiky pro více než 200 zemí a teritorii světa. V rámci statistik lze naleznout různé ukazatele ilustrující ekonomické trendy, vývoj počtu obyvatel, cenové indexy aj (Division, Monthly Bulletin of Statistics Online, 2021).Výběr dat lze provést za pomocí výběru tématu (finance, těžba aj.), země a časového období. Vybraná data pak lze zobrazit jako tabulku, stáhnout jako csv nebo XML.

Vyhledávání a získávání dat

Získání dat pomocí UNdata API

Data lze získat i pomocí API, které UNdata nabízí. Uživatelé mohou použít API k získání dat a zobrazení na webových stránkách nebo ke stažení do vlastního uložiště. API je implementováno jako webová služba REST a SOAP kterou lze použít k dotazovaní na datové tržiště pomocí SDMX. Pro úspěšné získání dat pomocí SOAP service je nutné vytvořit SDMX dotaz. Tento dotaz se dá vytvořit pomocí SDMX browseru ve kterém uživatel určí parametry dotazu.

Obr. 5 SDMX browser (UNdata SDMX Web Service)

Pro získání dat je nutné použít HTTP POST k odeslání dotazu SDMX, který získáte pomocí tlačítka Download Query v SDMX browseru. (Division, UNdata | api manual, 2021)

Jednoduché vyhledávání

Pro nenáročné uživatele nabízí UN data možnost vyhledávat jen pomocí klíčových slov. Výsledky jsou pak uživateli zobrazeny jako seznam, kde nastala shoda s klíčovým slovem. V rámci zjednodušení hledání nabízí stránka vybrání dalších filtrů, které konkretizují vyhledávání uživatele.

Obr. 6 základní vyhledávání na UNdata (UNdata search „Czechia“)

Vyhledávání pomocí procházení datových tržišť

Další možností procházení dostupných dat z webové aplikace UNdata je skrze odkaz „datamarts“. V rámci tohoto odkazu se uživatel dostane do módu „explorer“ ve kterém může procházet data dle samotného datového tržiště, tématu, kterého se data týkají nebo zdroje dat. Poté, co uživatel rozklikne jeden z bodů, tak se bod rozpadne na podtémata, které pod dané nadřazené téma patří.

Pro uživatele je zde připravena možnost pouhé ukázky dat, která zobrazí ukazateli prvních 10 záznamů v datové řadě a poskytne tak uživateli základní přehled o sloupcích v tabulce, datových typech nebo velikosti. Druhá možnost je přejít rovnou na data. V tomto případě je uživatel přesměrován na prostředí, ve kterém mu jsou nejen poskytnuty informace o daném datovém tržišti, ale lze data jednoduchými filtry prozkoumat nebo je možné data stáhnout ve formátu XML, csv nebo txt s různými separátory.

Obr. 7 mód explorer (UNdata explorer mode)

Pokročilé vyhledávání

Komplexní vyhledávání nabízí tzv. „advanced search“. Při použití pokročilého vyhledávání je možné definovat více kritérií, dle kterých chce uživatel vyhledávat. Tyto kritéria lze navolit skrze uživatelský přívětivé prostředí, nebo skrze textové pole pomocí zadání příkazu dle specifické syntaxe, kterou má tato webová aplikace.

Vymezení, která pro vyhledávání lze určit jsou pomocí státu, kontinentu nebo částí kontinentu. Dále lze upřesnit zdroj, ze kterého data mají pocházet (celkem je na výběr z 32 různých zdrojů) a na závěr časové období, které má být v datové řadě.

Obr. 8 Prostředí pro výběr pokročilého dotazu (UNdata advanced search)

Příkaz do textového pole je po vybrání kritérií vygenerován do textového pole a proveden. Poté jsou zobrazeny zdroje, které se shodují s kritérii, a zároveň je zobrazen příkaz, kterým je možné získat daný výpis. Pro komplexnější prohledávání webové stránky není ovšem nutné přecházet do grafického prostředí pokročilých filtrů, ale je možné napsat příkaz přímo do jakéhokoliv textového pole, které slouží pro vyhledávání.

Pokud bychom tedy chtěli hledat například v letech 2000 – 2020 pro Afriku ze zdroje „Population Estimates and Projections“ náš příkaz by vypadal takto:

area[Africa] 2000-2020 datamart[PopDiv]

Operátory pokročilého vyhledávání

Jak je zřejmé, v rámci „advanced search“ je možné si příkaz pro hledání napsat. Syntaxe pro příkaz hledání je specifická pro UNdata tento příkaz lze napsat do jakéholiv textového pole, které je připravené na vyhledávání v rámci webové stránky UNdata. 

Pro vymezení území je nutné použít klíčové slovo area a do hranatých závorek uvést jakých konkrétních území se má dotaz týkat. Je klíčové vědět, že je možné uvést pouze názvy v angličtině. Systém má předpřipravené vymezení území jako „All countries“ nebo jenom části kontinentu, např.: Central America, Eastern Asia nebo Eastern Africa. Vzorový příkaz pro vymezení území je například area[Africa, Australia].

Dále lze limitovat časové období, kterého se má datová řada týkat. Pro toto je možné použít klíčové slovo year a opět do hranatých závorek upřesnit jakých let se má dotaz týkat, například year[1990,2002,2010]. Pro vymezení časového období je možné také použít pouze zadání rozmezí, kterého se mají záznamy z časové řady týkat area[Africa, Australia] 1990-2020.

Poslední, co lze v dotazu u UNdata omezit je z jakého datového tržiště mají data pocházet. Toto lze učinit za pomocí klíčového slova datamart a vymezení jaké datové tržiště má vyhledávač uvažovat pomocí hranatých závorek datamart[UNAIDS,WHO].

Typologie a charakteristika dat

Datová tržiště obsahují data strukturovaná, většinou se jedná o prosté tabulky bez jakéhokoliv definovaného vztahu na jiné datové tržiště, a proto je možné jej jednoduše stáhnout a pracovat s nimi ve vlastním analytickém prostředí.

Obr. 9 Ukázka z vybraného datového tržiště (UNdata datamart WHO)

Z pohledu charakteristiky dat obsažených v datových tržištích je možné naleznout jak data kvantitativní (v obr. 13 sloupec „Value“) tak data kvalitativní.

Příklady využití dat

Vzhledem k obrovskému množství dat, které obsahuje webová aplikace UNdata je možné využití dat široké, ať už v soukromém sektoru tak veřejném.

Pro soukromý sektor je data možné využít například pro získání dat v rámci analýzy makroprostředí (např. PESTEL analýza), kde data získaná poskytnou informace o kvalitě infrastruktury v zemi (zdroj World Development Indicators), data o nezaměstnanosti (zdroj LABORSTA) nebo data o vzdělání (zdroj UIS Data Centre). Tyto data mohou pomoci rozhodnout se podniku, zdali se na daný zahraniční trh rozšíří nebo na jaké kritické problémy může podnik v rámci daného území narazit.

Pro využití ve veřejném sektoru je vhodné si představit nějakou veřejnou neziskovou organizaci (např. Člověk v tísni). Tato veřejná nezisková organizace může využít data OSN pro získání přehledu závažnosti problémů na jednotlivých územích a dle toho alokovat zdroje.

Závěr

UNdata obsahuje obrovské množství dat a data mohou být využita mnohými způsoby. Vyhledávání v rámci webové aplikace UNdata je jednoduché a syntaxe pro pokročilé vyhledávání je intuitivní. Pochopení webových stránek není elementární, protože obsahuje mnoho různých forem hledání, skrze které se dostane jednotlivec na totožné informace, nicméně každý způsob procházení datových tržišť si najde své uživatele, kteří budou daný přístup k datům preferovat.

Uživatelské rozhrání je jemné bez zbytečných prvků, které by uživateli mohli jakkoliv rozptylovat. Bylo by v každém případě vhodné udělat průvodce po stránkách, jehož cílem by bylo pomoci uživateli se zorientovat při prvním užívání.

 

Reference

Commission, E. (2021). NSI .NET Client. Načteno z data.un.org: https://data.un.org/SdmxBrowser/start

Division, U. N. (2021). Data.un.org. Načteno z Data.un.org: http://data.un.org/_docs/SYB/PDFs/SYB63_128_202009_Consumer%20Price%20index.pdf

Division, U. N. (2. 2 2021). Monthly Bulletin of Statistics Online. Načteno z https://unstats.un.org/: https://unstats.un.org/unsd/mbs/introduction.aspx

Division, U. N. (2. 2 2021). SDG Indicators. Načteno z https://unstats.un.org: https://unstats.un.org/sdgs/indicators/database

Division, U. N. (10. 2 2021). Undata. Načteno z UNdata: https://data.un.org/Default.aspx

Division, U. N. (31. 1 2021). UNdata. Načteno z http://data.un.org/default.aspx

Division, U. N. (1. 2 2021). UNdata | about us. Načteno z Web UNdata: http://data.un.org/Host.aspx?Content=About

Division, U. N. (2021). UNdata | advanced search. Načteno z data.un.org: http://data.un.org/AdvancedSearch.aspx

Division, U. N. (5. 2 2021). UNdata | api manual. Načteno z http://data.un.org/: http://data.un.org/Host.aspx?Content=API

Division, U. N. (2021). UNdata | explorer. Načteno z data.un.org: http://data.un.org/Explorer.aspx

Division, U. N. (2021). UNdata | record view | Age-standardized mortality rate by causes. Načteno z data.un.org: http://data.un.org/Data.aspx?q=age+standardized+mortality+rate&d=WHO&f=MEASURE_CODE%3aWHS2_3070_all

Division, U. N. (2021). UNdata | search results. Načteno z data.un.org: https://data.un.org/Search.aspx?q=Czechia

Division, U. N. (2021). UNdata app. Načteno z data.un.org: https://data.un.org/en/iso/cz.html

Kdo jsme a co děláme. (31. 1 2021). Načteno z https://www.osn.cz/icentrum/kdo-jsme-a-co-delame/

OSN. (31. 1 2021). Cíle organizace. Načteno z https://www.osn.cz/osn/cil/

STATISTICS, U. T. (2. 2 2021). What is UN comtrade? Načteno z https://unstats.un.org: https://unstats.un.org/unsd/tradekb/Knowledgebase/50075/What-is-UN-Comtrade