Twitonomy: Vyťažte maximum užitočných informácií zo sociálnej siete Twitter

Autor:

Branislav

-

25.3.2022

0

Úvod

Twitonomy je nástrojom, ktorý umožňuje pokročilé vyhľadávanie, analýzu a sledovanie aktivít na sociálnej sieti Twitter. Pre komplexné získavanie informácii zo sociálnych sietí typu Twitteru je v podstate nutné používať nejaký analytický pokročilejší nástroj, akým je napríklad Twitonomy.

Základné informácie

Dáta Twitonomy čerpá skrz API Twitteru, a preto je podmienkou pre akúkoľvek prácu s Twitonomy s ním mať prihlasovacie údaje k užívateľskému účtu na sociálnej sieti Twitter. Tento report je zameraný pre prácu s pokročilejším nástrojom Twitonomy, čím sa pre jeho použite predpokladá, že používateľ je zoznámený so základným fungovaním sociálnej siete Twiter a so všeobecnými termínami a názvoslovým z oblasti sociálnych sietí.

Využívanie Twitonomy je možné v rozhraní webového prehliadača na stránke https://www.twitonomy.com/ alebo po stiahnutí mobilnej aplikácie na platformách Android a iOS z Obchod Google Play a App Store.

Princíp funkcií na odlišných platformách je veľmi podobný, a preto tento návod bude zameraný len na webové rozhranie.

Je nutné poznamenať, že pre používanie Twitonomy existujú dve licencie pričom jedna je zdarma a druhá platená – Premium. Verzia Premium poskytuje viac vylepšených funkcií, napríklad možnosť exportu dát a prístup k jeho funkcionalitám bez obmedzení. Mesačný poplatok je vo výške 20 $ a tento návod sa bude venovať práve funkciám verzie Premium.

Funkcie

Na hornej časti obrazovky sa nachádza menu či ovládacia lišta, na ktorej sú hlavné „tlačidlá“ s oblasťami vyhľadávania, ktorými sa ovládajú základné funkcie vyhľadávača. Smerom zľava doprava sú to: Dashboard, Profile, Mentions & RTs, Search, Followers, Following, Lists, Account, Sign out a úplne vpravo je vždy prístupné okno pre vyhľadávanie hashtagu s použitím prefixu # alebo užívateľa s prefixom @.

Twitonomy: Vyťažte maximum užitočných informácií zo sociálnej siete Twitter — *Obr.1.* Záložka Dashboard, úvodná stránka Twitonomy [zdroj obrázku: Autor]

Po prihlásení sa cez Twitter účet sa nám automaticky ako prvé zobrazí okno Dashboard, ktoré slúži pre rýchly prehľad sledovaných objektov. Tu užívateľ vidí nedávnu aktivitu ním sledovaných účtov alebo aj špecifické kľúčové slová použité v tweetoch, ktoré sa rozhodol monitorovať. V pravo hore je možné nájsť štatistiky týkajúce sa rastu počtu followerov, following a tweetov. Na dashboarde je možné pridať a sledovať „list“, čo nie je nič iné ako dopredu definovaná skupina účtov, ktoré sledujeme.

Oblasť Profile je určená na vyhľadávanie všetkých informácií, ktoré súvisia s užívateľskými účtami. Hneď na vrchu je možné vidieť id účtu, dátum založenia a pomer sledovaných a sledovateľov užívateľa, ktorého výška značí vplyv užívateľa na sieti.

Je možné tu sledovať detailné štatistiky napríklad históriou, priemerný počet tweetov za deň, re-tweetov. Grafy a aj úplne celý zoznam tweetov účtu spolu s metadátami je možné vyexportovať vo formáte .xls alebo .pdf.

Obr.2. Záložka Profile v Twitonomy [zdroj obrázku: Autor]

Mentions & RTs je oblasť určená pre pohľad na „zmienky“ a re-tweety o užívateľovi. Čo je jedna z dôležitých funkcionálít siete Twitter, pomocou ktorej účty medzi sebou zdieľajú obsah.

Sú tu dostupné štatistiky, kedy bol užívateľ označený alebo zmienený v komentári či tweete pomocou @ alebo o jeho tweetoch, ktoré boli retweetnuté. Užitočná je funkcia geografického znázornenia účtov na mape od Google maps, ktorý zmienili nejakým spôsobom používateľa. Pomocou nej môže užívateľ vidieť svoj približný dosah do rôznych krajín.

V oblasti Search si používateľ vo vyhľadávacom okne zvolí účet či kľúčové slovo. A môže tak sledovať dáta nielen zo svojho profilu ale aj iných účtov. To môže byť prínosným nástrojom pri sledovaní konkurencie či úspešných účtov a dané informácie se dají použit na zlepšenie dosahu a počtu sledovateľov.

Čo sa týka kľúčových slov, je možné vidieť počet tweetov s daným výrazom za deň, potenciálny počet účtov, ktorý mohli daný termín vidieť, a zároveň najvplyvnejších a najaktívnejších užívateľov, ktorý ho zmienili. Najčastejšie hashtagy použité spoločne s termínom. Takisto je tu možné vygenerovať pohľad na svetovú mapu so značkami oblasti odkiaľ boli príspevky pridané za posledných 6-9 dní.

Followers

Pracuje ako filter „Followers“, ktorý sledujú náš účet. Je možné vybrať si zoznam:

a) všetkým sledovateľov

b) účty sledovateľov ktoré sledujem

c) účty sledovateľov ktoré nesledujem.

V jednotlivých stĺpcoch môžeme vidieť a radiť od najväčšieho po najmenšie či opačne: dátum založenia účtu, počet tweetov, počet Following, počet Followers koľkokrát je užívateľ súčasťou listu, a pred akým časom publikoval svoj posledný tweet.

Following

Pracuje ako filter „Following“, ktorých sledujeme. Je možné vybrať si zoznam:

a) všetkým mnou sledovaných účtov

b) účtov ktoré sledujem, ale nesledujú môj profil

c) účtov, ktoré ma sledujú.

V jednotlivých stĺpcoch môžeme vidieť a radiť od najväčšieho po najmenšie či opačne: dátum založenia účtu, počet tweetov, počet Following, počet Followers, koľkokrát je užívateľ súčasťou listu, a pred akým časom publikoval svoj posledný tweet.

Lists slúži k vytváraniu a úprave a sledovaniu zoznamu užívateľov.

Použitie

Twitonomy bude užitočný aparát pre niekoho, koho zaujíma verejná mienka a aktuálne trendy na internete.A aj keď sociálna sieť Twitter nie je až taká rozšírená v prostredí Českej a Slovenskej republiky, stále je tu možné nájsť dosť ľudí s veľkým vplyvom na verejnú mienku.

Nástroje tohto typu môžu využívajú marketingový špecialisti, ľudia z PR oddelení, žurnalisti, influenceri ale aj bežní ľudia, ktorý sa hlbšie zaujímajú o dianie na sociálnych sieťach. Pre profesionálnu prácu PR manažéra a marketingového guru je nutnosť vedieť analyzovať úspešnosť reklamných kampaní a aj jednotlivých príspevkov.

Oproti natívnym analýzam, ktoré poskytuje samotný Twitter, ponúka Twitonomy prehľady aj v aplikáciach na smartphone. Taktiež Twitonomy ponúka široký pohľad na dianie na Twittery a možnosť nahliadať na štatistiky iných užívateľov. Poskytuje tak cenný zdroj informácii, ktoré môže napomáhať k efektívnejšiemu využívaniu sociálnej siete.

Na druhú stranu je občas práca s Twitonomy neplynulá a vygenerovanie pohľadu trvá nejaký čas alebo sa stopne a je nutné stránku znovu obnoviť. Aj na základe dátumu výsledkov z vyhľadávania informácií o Twitonomy to vyzerá, že bez zásadnej aktualizácie má svoju najväčšiu slávu už pravdepodobne za sebou.

Záver

Tento report sa venoval základnej práci a funkciám nástroju Twitonomy, ktorý sa využíva k analýzam sociálnej siete Twitter, pričom z nej získava netriviálne informácie a štatistiky týkajúce vlastného ale aj iných účtov a ich vzájomných interakcií.

Zdroje

[1] Twitonomy [online] [cit. 11.2.2022a]. Dostupné na: https://www.twitonomy.com/dashboard.php

[2] Google Trends [online] [cit. 11.2.2022b]. Dostupné na: https://trends.google.com/trends/explore?date=2013-11-01%202022-02-11&q=twitonomy

Crossref: v pozadí prepája vedu už viac ako 20 rokov

Autor:

micz02

-

23.3.2022

0

Crossref je nezávislá nezisková organizácia založená v roku 2000 skupinou vydavateľov, ktorí potrebovali nástroj, ktorý by efektívne dokázal prepojiť ich publikované články medzi sebou [1]. Dnes je Crossref organizáciou pôsobiacou vo vyše 100 krajinách sveta a má viac než 11 000 členov, registruje viac než 72 000 vedecko odborných časopisov s takmer 80 miliónmi článkov, takmer 1,5 milióna kníh, viac než 68 000 konferečných zborníkov s viac než 6 miliónmi článkov [2]. K tomu Crossref využíva takzvaný Digital Object Identifier, ktorý sa častejšie vyskytuje v jeho skrátenej podobe DOI, zároveň je Crossref aj oficiálnou registračnou agentúrou DOI identifikátorov. Princíp spočíva v tom, že DOI identifikátor spojí registrovaný objekt s jeho elektronickou URL adresou v centrálnom adresári. V prípade, že bude vydavateľ v budúcnosti presúvať dokument na inú URL adresu, tak stačí zadať zmenu do adresára a DOI bude prepojené s novou URL adresou, v celom procese však zostáva DOI identifikátor registrovaného objektu nemenný.

Okrem prepojenie DOI identifikátora s URL adresou registrovaného objektu, však musí vydavateľ pri registrácii objektu zadať aj ďalšie potrebné metadáta, ktoré sú potrebné aby sa zápis do registra mohol uskutočniť. Týmito metadátami sú ďalšie bibliografické údaje, napríklad v prípade príspevku vo vedeckom odbornom časopise sa jedná o názov časopisu, ISSN, meno prvého autora, rok, zväzok, číslo časopisu a počet strán [3]. Crossref ponúka širokú paletu služieb, ktorých cieľom je registrácia, vzájomné prepojenie a distribúcia vedeckých metadát [4]. Všetky tieto služby budú popísané v nasledujúcich podkapitolách.

Zber metadát (Metadata Retrieval)

Vydavateľ obsahu registruje svoj obsah v databázach Crossref, aby tak dal svetu vedieť, že daný dokument existuje. Táto registrácia prebieha už spomínaným poskytnutím relevantných metadát. Následne Crossref poskytuje tieto metadáta verejne skrz svoje rozhrania pre programovanie aplikácii (APIs). Každý tak môže tieto metadáta vyhľadať a použiť v rámci svojich vedeckých nástrojov. Knižničné systémy, vyhľadávače, citačný software, rôzne databázy a rôzne ďalšie služby využívajú následne tieto metadáta v rámci svojich databáz [5].

Crossref: v pozadí prepája vedu už viac ako 20 rokov — Obrázok 1: Zber metadát (Zdroj: upravené podľa [5])

Registrácia obsahu (Content registration)

Registrácia obsahuje umožňuje členom Crossref registrovať a prípadne aj aktualizovať metadáta konkrétneho obsahu. Registráciou nového obsahu sa tento obsah stáva dostupným pre veľké množstvo systémov a organizácií, ktoré spoločne pomáhajú odkazovať a zvyšovať citovanosť diela, reportujú impakt financovania, zaznamenávajú aktivitu a sledujú výsledky [6].

Prepojenie odkazov (Reference linking)

Odborný článok má v závere zoznam použitých zdrojov z ktorých autori čerpali pri písaní svojho článku. Indexácia týchto odkazov umožňuje vzájomné prepojenie jedného dokumentu s množstvom ďalších dokumentov. Okrem ďalších článkov sa však autori môžu odkazovať aj na ďalšie aspekty, ktoré podporili ich výskum, napríklad na použitie konkrétnych údajov. Správne označovanie odkazov a ich indexácia do databáz Crossref teda môže slúžiť mnohým ďalším čitateľom a výskumníkom, ktorým uľahčuje prácu s hľadaním potenciálnych zdrojov [7].

Cited-by

Hlavným cieľom služby Cited-by je poskytnúť užívateľovi jednoduchý prehľad o tom, koľkokrát bol daný dokument citovaný a taktiež poskytnúť priame prepojenia na ďalšie dokumenty, ktoré pôvodný dokument citovali. Ide o recipročný princíp, pretože poskytnutím metadát od členov Crossref, ktorými sú vydavatelia, umožňuje ďalším participujúcim členom získať prehľad, ktoré články citujú ich vlastné publikované články. Využívanie tejto služby teda sprehľadňuje súvisiaci výskum a umožňuje autorom a vydavateľom vidieť ako bolo ich dielo prijaté širšou komunitou [8].

Kontrola zhody (Similarity check)

Crossref za poplatok poskytuje svojim členom možnosť využívania služby Similarity Check, ktorá využíva systém iThenticate. Editory časopisov tak majú k dispozícii jednoduchý a užívateľsky prívetivý systém, ktorý im umožňuje odhaliť plagiátorstvo v momente, keď sa rozhodujú o publikovaní článku. Systém jednoducho porovná dokument s miliónmi publikovaných článkom a miliardami webových stránok, na základe čoho systém vyhotoví prehľadný report, v ktorom sú zobrazené potenciálne zhody a ukazovatele toho, ako sa daný dokument prelína s ďalším výskumom v danej oblasti [9].

Crossmark

Výskum nie vždy končí publikáciou článku, niekedy je potrebné článok aktualizovať, urobiť v ňom korekcie alebo k nemu priložiť podporné dáta. Je preto dôležité vedieť pri citovaní zdrojov či bol tento zdroj aktualizovaný, opravený alebo stiahnutý. Práve k tomu slúži služba Crossmark, ktorá má podobu štandardizovaného tlačidla naprieč všetkými platformami, ktoré túto službu využívajú. Po stlačení tlačidla sa zobrazia všetky relevantné informácie o statuse zvoleného dokumentu. Výhodou je, že toto tlačidlo je možné aj priamo implementovať do PDF dokumentov, čo znamená, že vydavatelia môžu čitateľov upozorniť na zmeny pokojne aj roky po vydaní pôvodného zdroja [10].

Záver

Niektoré zo služieb Crossref sú voľne dostupné v podobe ich API, poplatky platia iba jednotlivý členovia Crossref, teda členské vydavateľstvá. V tomto prípade sa platí ročný členský poplatok, ktorého výška sa odvíja od obratu dodávateľa od 275 USD do 50 000 USD pre členov s obratom väčším ako 500 miliónov USD. Ďalším poplatkom, ktorý platia členovia je registračný poplatok za každú pridanú položku, napríklad za pridanie odborného článku sa platí 1 USD. Vzhľadom na úspech Crossref a rastúci počet členov, ktorý je exponenciálneho charakteru je však možné predpokladať, že cenová politika je nastavená spravodlivo [2].

Crossref v pozadí prepája vedu už viac ako 20 rokov a vzhľadom na množstvo poskytovaných služieb, exponenciálne pribúdanie nových členov, rastúce množstvo obsahu a celkovo zvyšujúcu sa úroveň významu, ju zrejme bude prepájať aj naďalej.

Použité zdroje

[1] COLLINS, Susan. Introducing Crossref, the basics. Journals & Authors [online]. 2018 [cit. 2022-02-10]. Dostupné z: https://jasolutions.com.co/crossref/introducing-crossref-basics/

[2] Crossref Annual Report & Fact File 2018-19. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z:https://doi.org/10.13003/y8ygwm5

[3] HOWELLS, Matt. CrossRef: an overview. Editors’ Bulletin [online]. 2006, 2(1), 12-16 [cit. 2022-02-10]. ISSN 1752-1742. Dostupné z: doi:10.1080/17521740701702073

[4] Metadata enables connections. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/services/

[5] Metadata Retrieval. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-metadata-retrieval.pdf

[6] Content Registration. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-content-registration.pdf

[7] Reference Linking. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-reference-linking.pdf

[8] Cited-by. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-cited-by.pdf

[9] Similarity Check. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-similarity-check.pdf

[10] Crossmark. Crossref [online]. 2021 [cit. 2022-02-10]. Dostupné z: https://www.crossref.org/pdfs/about-crossmark.pdf

De Gruyter – důvěrohodné vědecké nakladatelství v informačním věku

Autor:

Alikhan Merzhoev

-

21.3.2022

0

Obrázek 1: Průměrné množství dat, produkované za minutu. Zdroj: (Domo, 2021)

Úvod

V současně době je informační gramotnost důležitá jako nikdy před tím. V moderním světě nejen máme možnost využívat ve prospěch libovolnou informace, ale zároveň čelíme výzvám, které jsou s danou možnosti spojené. Momentálně lidstvo generuje obrovské množství dat, a hledání opravdu kvalitní informace v takovém proudu je občas docela obtížné. Daný problém se stává ještě aktuálněji během posledních let kvůli obrovskému šíření dezinformace ohlední pandemie. Následující obrázek představuje přehled o množství dat, které se generuje každou minutu.

Zdá se to zřejmé, že za takových podmínek musíme se spoléhat na kvalitní, spolehlivé a důvěryhodné zdroje. Jednou z možnosti je čerpaní informaci z kvalitních vědeckých zdrojů. Právě s tím pomáhá De Gruyter. De Gruyter je jedním z největších nezávislých akademických nakladatelství ve světě, které se specializuje na publikace vědeckých článku a knih z nejrůznějších oblasti. Kromě toho, nakladatelství má partnerské vztahy s velkým množstvím vědeckých a vysokoškolských nakladatelství po celém světě, jako jsou Harvard University Press, Academic Studies Press, atd.

Co poskytuje De Gruyter

Zaprvé, samozřejmě, nakladatelství poskytuje uživatelům přistup k velké řádě vědeckých dílů. Více než tisíce knih z různých oborů jsou dostupné zdarma. Kromě toho, pokud jste studentem nebo zaměstnancem partnerské vysoké školy, máte přistup ještě k dalším kníhám a časopisům. Zároveň uživatele mohou zajistit přistup k více než padesáti databázím.

Navíc De Gruyter poskytuje autorům vědeckých článku možnost publikace ve vědeckých časopisech. Před publikaci review každého článku dělají minimálně dva lidí, kteří neví, kdo je autorem, což podporuje nezávislost expertních posouzení.

Autoři knih mají možnost publikace taky Open Access, což potencionálně výrazně zvyšuje počty čtenářů a citaci. Kromě toho, jako i vědecké články, všichni knihy nakladatelství prochází review procesem, který dělají lidí, které jsou vědci nebo akademici, specializující se na vědeckou oblast titulu. Nakonec, všichni autoři dostávají zpětnou vazbu pro zlepšení svého dílu. Taky autoří mají možnost ziskat stipendium od nadačního fondu nakladatelství.

Nakonec, poskytuje nakladatelství služby pro knihovny, dovolující knihovnám zajistit pro své uživatele přistup ke katalogu nakladatelství a jeho partnerů. (De Gruyter, 2022)

Knihy

De Gruyter — Obrázek 2: Vyhledávání knih v katalogu nakladatelství. Zdroj: Autor

Uživatele mají možnost vyhledávání knih mezi 30 různými tématy, jako jsou chemie, informatika, dějepis, právo a mnoho dalších. Zároveň umožňuje web vybrat jazyk publikace. Většina knih je v němčině, ale mají mnoho dílů v angličtině, ruštině, řečtině, arabštině a dalších jazycích. Nakonec, může uživatel vybrat, jestli je hledána publikace Open Access, dostupná, pokud má licence ze své instituce, nebo jestli za knihu musí zaplatit. Taky je možnost výběru období, ve kterém kniha byla publikována. (De Gruyter, 2022)

Časopisy

De Gruyter - důvěrohodné vědecké nakladatelství v informačním věku — Obrázek 3: Vyhledávání časopisů v katalogu nakladatelství. Zdroj: Autor

V době napsání daného článku má De Gruyter ve svém katalogu 418 vědeckých časopisů, ze kterých 132 jsou veřejné dostupné. Většina časopisů je v angličtině, ale, stejně jako u knih, můžete vyhledat něco i v různých dalších jazycích. Rozsah vědeckých oblasti, na které se časopisy zaměřují, je téměř stejně široký jako u knih. (De Gruyter, 2022)

Databáze

Pokročilé vyhledávání

Mimo jiné umožňuje web nakladatelství svým uživatelům taky i pokročilé vyhledávání. Májí možnost výběru konkrétního typu dokumentu, buď je to článek, kniha, kapitola, databáze, časopis atd. Taky je možně kromě názvu dílu zadat DOI/ISBN/ISSN. Nakonec, máte možnost vybrat konkrétní rozmezí let, ve kterých bylo vámi hledání dílo zveřejněno. (De Gruyter, 2022)

Stipendia pro akademické pracovníky

Má nakladatelství taky svůj nadační fond. Nadace Waltera de Gruytera je nezisková organizace, která podporuje výzkum a vydává stipendia se zaměřením na humanitní obory. Je pojmenována po Walteru de Gruyterovi, jako i samotné nakladatelství. V roce 2006 tři vnučky Waltera de Gruytera spoluzaložily nadaci jeho jména, aby pokračovala v míse nakladatele, který byl také společensky angažovaným mecenášem. Většina dotací fondu pochází z 10% podílu ve společnosti Walter de Gruyter.

Posláním nadace je podle její charty podporovat výzkum a stipendium. Konkrétně sem patří:

Financování výzkumu v humanitních oborech

Poskytování stipendií pro nadějné mladé spolupracovníky v akademickém publikování

Udělování cen za vynikající akademické výsledky v humanitních vědách

Darování knih akademickým knihovnám v zahraničí

Nadace každoročně financuje pět až deset projektů, přičemž granty se pohybují od 1 000 do 10 000 eur. Správní rada se schází dvakrát ročně, aby rozhodla o financování. Ve většině případů jsou granty poskytovány jednorázově. Nadace nefinancuje osobní náklady a náklady na tisk.

Fond každoročně financuje pět až deset projektů, přičemž granty se pohybují od 1 000 do 10 000 eur. Správní rada se schází dvakrát ročně, aby rozhodla o financování. Ve většině případů jsou granty poskytovány jednorázově. Nadace nefinancuje osobní náklady a náklady na tisk a jubilea. (De Gruyter, 2022)

Pokud byste chtěli požádat o grant, žádosti by měly být adresovány výkonné radě nadace a měly by obsahovat následující informace:

Jméno a adresa žadatele
Krátké shrnutí projektu (ne více než dvě stránky)
Informace o celkových nákladech spolu s dalším financováním od dárců
doporučující dopisy (pokud existují)

Závěr

Na závěr se dá říct, že De Gruyter je opravdu dobrým pomocníkem člověka buď na cestě hledání kvalitních zdrojů informace, nebo na cestě publikace svého vědeckého díla.

Reference

De Gruyter. (2022). De Gruyter. Načteno z De Gruyter : https://www.degruyter.com/

De Gruyter. (2022). WALTER DE GRUYTER FOUNDATION. Načteno z De Gruyter: https://www.degruyter.com/publishing/about-us/about-dg/dg-foundation

Domo. (2020). Data Never Sleeps 9.0. Načteno z Domo: https://www.domo.com/learn/infographic/data-never-sleeps-9

Seznám obrázků

Obrázek 1: Průměrné množství dat, produkované za minutu. Zdroj: (Domo, 2020)

Obrázek 2: Vyhledávání knih v katalogu nakladatelství. Zdroj: Autor

Obrázek 3: Vyhledávání časopisů v katalogu nakladatelství. Zdroj: Autor

Obrázek 4: Vyhledávání databázi v katalogu nakladatelství. Zdroj: Autor

Obrázek 5: Pokročilé vyhledávání v katalogu nakladatelství. Zdroj: Autor

Hlídač státu: Posviťte si nejenom na státní správu

Autor:

cermatej

-

18.3.2022

0

woman holding sword statue during daytime

Úvod

Poslední roky můžeme být svědky raketového růstu v oblasti informačních technologií. Růstu, který neustále zrychluje a v soukromé sféře nahrává spoustu novým společnostem a startupům, které tento růst dokáží sledovat a profitovat z něj. Spoustu úkonů se snažíme zautomatizovat použitím technologií a ve spoustě odvětví se nám i daří, avšak státní správa se zdá být stále zaseklá několik desítek let v minulosti. Reakcí na tuto skutečnosti je čím dál více a kromě apelů některých politických stran vznikl i projekt Hlídač státu.

Hlídač státu

Hlídač státu je nezisková organizace, která bojuje za transparentnost státní správy. Snaží se toho docílit zpřístupněním dat z registru smluv, veřejných zakázek, dotací, sponzorů politických stran a politiků na svém webové platformě Hlídač státu, která zastřešuje všechny jejich aktivity.

Organizace byla založena v roce 2017, ale i za tak krátkou dobu se dokázala etablovat jako jedna z subjektů, které pomáhají odhalovat korupční aktivity. Pomáha však i aktivně zefektivňovat státní správu odhalováním úzkých míst a současně se snaží státní správě radit jak situaci zlepšit. Jedním z dalších větších cílů projektu je osvětová činnost v oblasti otevřených dat.

Za Hlídačem smluv stojí Michal Bláha, přední osobnost v oblasti eGovernmentu, inovací a otevřených dat v českém prostředí. Projekt Hlídač státu obdržel za svou existenci několik ocenění včetně Křišťálové lupy za projekt roku.

Součástí hodnocení subjektů i je tzv K-index, který slouží k jako identifikátor, který může napovídat na nestandartní chování u některých subjektů a poukazovat tak na nekalou činnost. Pod indexem, který známkuje od A do F poté najdeme slovní hodnocení, proč tuto známku subjekt obdržel. Konkrétně u České pošty je tento index na nejhorší hodnotě F jak můžete vidět na obrázku.

Rychlé zobrazení rizikovost v systému Hlídač státu.

Součástí Hlídače státu jsou i různé analýzy a reporty vytvořené právě nad daty, které lze na serveru najít. Obsahuje spoustu zajímavých analýz, které jen potvrzují, že postupné zpřístupňování otevřených dat dává smysl.

Licence

Projekt je financován pomocí darů jedinců či subjektů a jeho použití je bezplatné, což je v souladu s vizí projektu na transparentnost dat veřejnosti. Na server je možné narazit i při vyhledávání některých subjektů na Google. Bezplatná je i registrace, která otevírá další možnosti použití o kterých se zmíním v článku.

Vyhledávání na Hlídači státu

Server na své hlavní stránce poskytuje vyhledávání s našeptáváním a proto je možné velmi rychle vyhledat určitě subjekty a od nich dále pokračovat.

Příklad vyhledávání v systému Hlídač státu.

Při rozkliknutí subjektu je poté možné zobrazit smlouvy navázané na tyto subjekty (často i s finanční hodnotou této smlouvy), veřejné zakázky, vyplacené dotace, záznamy v insolvenčních rejstřících a také i zmíněný K-index subjektu. Registr smluv poté zobrazuje i souhrnné statistiky všech smluv.

Souhrn odkazuje i na smlouvy u kterých bylo automatizovaně zjištěna určitá nesrovnalost. V tomto případě například pozdní uveřejnění smlouvy.

Pro registrované uživatele (zdarma) je na stránce subjektu je možné nastavit hlídacího psa na nově vzniklé smlouvy tohoto subjektu.

Mezi subjekty samozřejmě patří i FO, na které se váže spousta dalších veřejných informací.

Pokročilé vyhledávání

Prostředí Hlídače smluv mi osobně přijde velmi intuitivní a bylo velmi jednoduché se v něm zorientovat. V případě, že má ale subjekt hodně smluv může uživatel využít pokročilého hledání, které nabízí možnost zúžit vyhledávaná data na ty opravdu důležitá. Kromě základních operátorů jako OR (disjunkce, operátor OR) nebo konjunkce (vyjádřena mezerou), které fungují podobně jako na Google, vyhledávač podporuje i pokročilé operátory. Tímto způsobem bychom například vyhledali smlouvy, které jsou mezi Českou poštou a O2 IT Services s.r.o. a částka přesahuje 2 miliardy korun.

icoPlatce:47114983 icoPrijemce:02819678 cena:>2000000000

Závěr

Za jakýkoliv projekt, který má za cíl transparentnost a bojuje za otevřená data jsem rád a má mé osobní sympatie. V některých případech může projektu překážet nedostatek dat u některých zdrojů, který souvisí s nízkou flexibilitou úřadů, což je ale skutečnost, kterou projekt aktivně řeší. Hlídač státu proto má své místo na české scéně a získaná ocenění to jenom potvrzují.

Použité zdroje

[1] Vize – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://texty.hlidacstatu.cz/vize/

[2] Snadné hledání – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://texty.hlidacstatu.cz/snadne-hledani/

[3] Nápověda – jak hledat v Hlídači [online]. [cit. 2022-02-11]. Dostupné z: https://www.hlidacstatu.cz/napoveda

[4] Tipy – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://texty.hlidacstatu.cz/series/tipy/

[5] Česká pošta, s.p. – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://www.hlidacstatu.cz/subjekt/47114983

[6] Andrej Babiš – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://www.hlidacstatu.cz/osoba/andrej-babis

[7] Vyhledávaní – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://www.hlidacstatu.cz/hledat?q=icoPlatce%3A47114983+icoPrijemce%3A02819678+cena%3A%3E2000000000

[8] Rámcová kupní smlouva na odběr cenin a filatelistického zboří – Hlídač státu [online]. [cit. 2022-02-11]. Dostupné z: https://www.hlidacstatu.cz/Detail/19341531?qs=ico%3A47114983+AND+chyby%3Avazne+AND+datumUzavreni%3A%5B2022-01-01+TO+2023-01-01%7D

NUŠL: Národní uložiště šedé literatury, aneb místo, kde je uložena možná i vaše práce

Autor:

Hana Marková

-

16.3.2022

0

NUŠL: Národní uložiště šedé literatury, aneb místo, kde je uložena možná i vaše práce — Obrázek 0: Logo NUŠL, Zdroj: [13]

1. Úvod

Národní uložiště šedé literatury (NUŠL) je systém poskytující centrální přístup k informacím o šedé literatuře vznikající v České republice v oblastech vědy, výzkumu a vzdělání. NUŠL představuje Centrální rozhraní NUŠL pro vyhledávání šedé literatury a Digitální repozitář NUŠL pro dlouhodobou archivaci a zpřístupnění šedé literatury. Centrální rozhraní i digitální repozitář je volně přístupný veřejnosti. [1, 2]

Šedá literatura je nepublikovaná nebo polopublikovaná literatura, která je vydávána institucemi, jejichž hlavní náplní není vydavatelská činnost. Tyto instituce mohou být vládní, akademické, obchodní nebo průmyslové. Příkladem šedé literatury jsou výroční zprávy, vysokoškolské kvalifikační práce, konferenční materiály či firemní literatura. [3]

Motivací pro vznik NUŠL byla touha vytvořit jedno místo, odkud by se mohlo k šedé literatuře vzniklé v ČR přistupovat. NUŠL má spolupráci s několika mezinárodními systémy pro uchování šedé literatury, díky čemuž je možné šedou literaturu vyprodukovanou na území ČR vyhledat i v zahraničí. Příklady těchto systémů je GreyNet International nebo OpenGrey. [4]

Vývoj systému NUŠL probíhal v letech 2008-2011 za podpory Národní technické knihovny (NTK) a VŠE v Praze. V současné době je provozovatel systému pouze Národní technická knihovna. [5]

2. Struktura NUŠL

NUŠL nabízí několik možností spoluprací pro instituce. Prvním možností je napojení vlastního repozitáře (např. v systému DSpace) na NUŠL. Tj. v Centrálním rozhraní NUŠL je možné dokument vyhledat, po rozkliknutí dokumentu je uživatel přesměrován do repozitáře instituce.

Druhou možností je také napojení vlastního repozitáře na NUŠL s tím rozdílem, že se dokumenty v NUŠL i dlouhodobě archivují. Tj. v Centrálním rozhraní NUŠL je možné dokumenty vyhledat, po rozkliknutí dokumentu je uživatel Přesměrován do Digitálního repozitáře NUŠL.

Ve třetí možnosti spolupráce instituce nemá vlastní repozitář, a tak dokumenty vkládá přímo do Digitálního repozitáře NUŠL. Vyhledávání vloženého dokumentu probíhá stejně jako ve druhém případě. [6]

Více jsou jednotlivé spolupráce popsány na obrázku 1.

3. Digitální repozitář NUŠL

Digitální repozitář je vytvořen v open source softwaru Invenio, který slouží pro správu digitálních knihoven a repozitářů. Pro potřeby NUŠL byly provedeny úpravy softwaru Invenio, například se upravilo grafické rozhraní, udělala se plná lokalizace do českého jazyka nebo se upravilo prohlížení záznamů. [7]

V digitálním repozitáři jsou uloženy dokumenty (zprávy, metodiky, analýzy, aj.) a podpůrné materiály k vlastnímu dokumentu – prezentace, tabulky, grafy, videa, audio nahrávky. Přístupné formáty jsou: PDF, JPEG, MP3 a MP4. [8]

3.1. Typologie dokumentů

Typologie přijímaných dokumentů do Digitálního repozitáře NUŠL je znázorněna na obrázku 2.

3.2. Vyhledávání

Hlavní strana Digitální repozitáře NUŠL viz obrázek 3.

3.2.1. Stromové hledání

V levé části hlavní strany (obrázek 3) je možné dokumenty vyhledávat pomocí stromu neboli již zmíněné topologie dokumentů. Vyhledávání dokumentů probíhá pomocí kategorií a jejich podkategorií. Tyto kategorie a podkategorie jsou stejné jako na obrázku 2. Například kategorie Konferenční materiály je dělena na podkategorie Postery, Programy, Příspěvky z konference a Sborníky. Po zvolení jedné z podkategorií se zobrazí dokumenty přiřazené do dané podkategorie.

Další možnost stromového prohledávání je v pravé části hlavní strany (obrázek 3). Zde lze dokumenty hledat podle jejich zaměření. Každé zaměření se dělí na podzaměření, například zaměření Věda a výzkum se dělí na podzaměření AV ČR, Veřejné výzkumné instituce a Výzkumné ústavy. U většiny podzaměření je dále třeba zvolit oblast zájmu, a tedy až po zvolení oblasti se zobrazí přiřazené dokumenty. Například u podzaměření AV ČR je možné vybrat konkrétní ústav, jehož dokument hledám. [10]

3.2.2. Jednoduché hledání

Na hlavní straně (obrázek 3) je přednastavené jednoduché vyhledávání, které je detailněji ukázáno na obrázku 4.

V jednoduchém hledávání je k dispozici je jedno textové pole pro dotaz a možnost výběru jednoho z rejstříků, který se bude prohledávat. Je možné si zvolit jeden z rejstříků: název, autoři, klíčová slova, datum zveřejnění, instituce, typ dokumentu, název konference, ISBN/ISSN, číslo projektu, plný text a číslo záznamu.

Po prvním vyhledání se zobrazí nová struktura jednoduchého vyhledávání viz obrázek 5.

Nově je možnost vybrat sbírku, ve které se vyhledává, například je možné vybrat sbírku Banky. Dále se může určit časové období, ve kterém byl dokument přidán či změněn. V posledním výběru je možné určit, jak budou dokumenty seřazeny, kolik dokumentů a v jakém formátu se mají zobrazit.

3.2.2. Rozšířené hledání

Rozšířené hledání je možné zvolit na hlavní stránce (obrázek 3) pod hledáním jednoduchým. Rozšířené hledání je detailněji ukázáno na obrázku 6.

V rozšířeném hledání jsou k dispozici tři textová pole pro zadání dotazu, s tím že se každý dotaz ještě může specifikovat pomocí výběru před a za dotazem. Před dotazem je možné vybrat způsob vyhledávání dotazu. Možnosti jsou: Všechna tato slova, Jedno ze slov, Přesná fráze, Část výrazu a Regulární výraz. Za dotazem je výběr repozitáře, stejný jako byl u jednoduchého hledávání, viz kapitola 3.2.2.

Poslední výběr na řádkách slouží ke spojení dotazů, možnosti jsou A, NEBO a A NE. Tyto znaky odpovídají Booleovských operátorů AND, OR a NOT. Více o booleovských operátorech v kapitole 3.2.3.

Dále je možnost určit časové období, ve kterém byl dokument přidán či změněn. Stejně jako u jednoduchého vyhledávání je možné určit, jak budou dokumenty seřazeny, kolik dokumentů a v jakém formátu se mají zobrazit.

3.2.3. Syntaxe a operátory

V rámci jednoduchého vyhledávání je možné použít syntaxe a operátory, díky kterým se lze v jednoduchém vyhledávání dotazovat stejně komplexně jako v rozšířeném vyhledávání.

Ve hledaném výrazu je možné použít booleovské operátory:

AND, + a mezera najde všechny záznamy, které obsahují výraz před AND, + nebo mezerou i výraz za.
NOT a – najde všechny záznamy, které obsahují výraz před NOT nebo – ale neobsahují výraz za.
OR a | najde všechny záznamy, které obsahují alespoň jeden z výrazů před OR nebo | nebo za.

Ve hledaném výrazu je možné použít uvozovky:

Žádné uvozovky automaticky doplní booleovský výraz AND mezi dotazovaná slova.
Dvojité uvozovky vyhledají přesnou frázi mezi dvojitými uvozovkami.
Jednoduché uvozovky vyhledají dílčí fráze. Na rozdíl od dvojitých uvozovek se v tomto vyhledávání zohledňuje i text před nebo za zadaným výrazem v uvozovkách.

Ve hledaném výrazu je možné použít kulaté závorky:

Kulaté závorky sloučí booleovské výrazy do skupin.

Ve hledaném výrazu je možné použít speciální znaky a interpunkce:

Vyhledávač správně vyhodnotí znaky speciální znaky a interpunkce. Například + ve slově C++.

Ve hledaném výrazu je možné použít mezinárodní znaky:

Vyhledávač pracuje s Unicode UTF-8, takže se dotaz může psát v jakémkoli jazyce. Například, když chci vyhledat dokumenty od Rusa, jehož jméno bude napsáno v azbuce.

Ve hledaném výrazu je možné vyhledávat se zástupným znakem *:

S pomocí zástupného znaku * je možné jako dotaz napsat pouze část slova. Například vyhledávaný výraz Soft* najde slova jako software nebo softwarový. Hvězdička může být zadána i uprostřed slova, tedy je určen začátek a konec vyhledávaného slova, prostředek může být libovolný.

Ve hledaném výrazu je možné zadat metadatovou strukturu:

Vyhledávání v rámci bibliografických polí jako je autor (author), název (title), abstrakt (abstract) nebo klíčových slov (keywords) je možné pomocí dvojtečky. Například, když chci najít dokument jehož autor je Marek a v názvu má slovo software, zadám výraz: author:marek title:software. [12]

4. Centrální rozhraní NUŠL

Centrální rozhraní je vytvořeno v open source systému Elasticsearch, které poskytuje zabezpečené, relevantní a škálovatelné vyhledávání nad připojeným repozitářem. Cílem tohoto řešení je zpřístupnit uživatelům data jak z digitálního repozitáře, tak data ze spolupracujících uložišť šedé literatury v jednom interaktivním prostředí. [7]

Hlavní strana Centrálního rozhraní NUŠL viz obrázek 7.

4.1. Vyhledávání

Vyhledávání dokumentů v Centrálním rozhraní probíhá především pomocí levé navigace viz obrázek 7. Zde je možné vyhledávat podle typu dokumentu, osoby, klíčového slova, jazyku a toho, zda hledáme plný text.

Vyhledávání podle typu dokumentu, viz obrázek odpovídá kategoriím ukládaných v Digitálním repozitáři, ke kterým je přidána kategorie Ostatní. Tyto kategorie odpovídají typologii dokumentů zobrazené na obrázku.
V sekci vyhledávání podle osob je na výběr ze seznamu nejčastějších institucí, pod jejichž záštitou byl dokument vytvořen, nebo osob, které se podílely na tvorbě některých dokumentů. Tyto osoby buď jsou samy autory dokumentu nebo v případě vysokoškolských prací můžou být vedoucími. Vždy jsou zobrazeny první čtyři osoby či instituce, po rozkliknutí zobrazit více se zobrazí dalších 16.
V sekci vyhledávání podle klíčových slov je na výběr ze seznamu nejčastějších klíčových slov používaných v dokumentech. Vždy jsou zobrazeny první klíčová slova, po rozkliknutí zobrazit více se zobrazí dalších 16.
V sekci vyhledávání podle jazyka je na výběr ze seznamu jazyků, kterými jsou dokumenty napsány.
V sekci plný text je na výběr ze dvou možností ano a ne. Ano pokud chci vyhledat plný text, ne pokud nechci.

Dále je možné v Centrálním rozhraní vyhledávat pomocí horní zelené lišty, která odpovídá stromovému vyhledávání zaměření v pravé části hlavní strany Digitálního repozitáře.

V Centrálním repozitáři je možné omezit množství vyhledaných dokumentů pomocí zúžení časového období na časové ose v horní části obrazovky.

Poslední možností, jak v Centrálním rozhraní vyhledávat je pomocí vyhledávacího pole. Toto vyhledávání nepracuje se syntaxí ani operátory.

Všechny použité filtry se zobrazují v levé části stránky nad navigací. Podle zvolených filtrů se mění i nabídka v levé navigaci i podzaměření v horní liště. Tedy filtry mají vliv na seznam možností, ze kterých můžeme vybírat, abychom mohli hledat už jen mezi takovými dokumenty, kterými chceme. Všechny použité filtry lze odmazat kliknutím na červený křížek u Použitá oznámení nebo lze smazat jen jeden z filtrů kliknutím na červený křížek u daného filtru.

Vyhledané dokumenty se zobrazí pod sebou uprostřed strany, viz obrázek. U každého dokumentu je napsán jeho název, autor (autoři), instituce, rok vydání a část anotace. Po najetí myší na šedé i před názvem práce, se zobrazí název práce, autor (autoři), rok vydání, jazyk, ve kterém je práce napsaná, všechny verze anotace, všechna klíčová slova a repozitář, ve kterém je práce uložená (Digitální repozitář či externí repozitář instituce).

5. Příklad využití

5.1. Hledám bakalářskou práci studentky ČVUT Hany Markové, jejíž vedoucí byl Pavel Náplava

Pro vyhledávání bakalářské práce použiji filtry viz obrázek 8.

Dne 9.2.2022 je jako sedmý vyhledaný dokument bakalářská práce Hany Markové viz obrázek 9.

Po kliknutí na název práce je uživatel přesměrován na externí repozitář ČVUT DSpace viz obrázek 10.

Na konci stránky jsou odkazy, kterými lze práci stáhnout.

5.2 Hledám dokumenty z NTK vydané mezi lety 2015-2020

Pro vyhledávání dokumentů použiji filtry viz obrázek 11.

Centrální repozitář vyhledal několik dokumentů. Dne 9.2.2022 je jako druhý vyhledaný dokument s názvem Prostor jako služba viz obrázek 12.

Po kliknutí na název práce je uživatel přesměrován do Digitálního repozitáře NUŠL viz obrázek 13.

Po překliknutí na záložku soubory lze dokument Prostor jako služba stáhnout.

6. Závěr

Národní uložiště šedé literatury (NUŠL) zpřístupňuje šedou literaturu vydávanou na území ČR veřejnosti. Skládá se z Centrálního rozhraní a Digitálního repozitáře. Cílem NUŠL je možnost přístupu k šedé literatuře z jednoho místa.

NUŠL je velmi přínosný jednak pro uživatele, kteří mohou vyhledávat dokumenty šedé literatury v Centrálním rozhraní a jednak pro instituce, které si mohou v Digitálním repozitáři archivovat své dokumenty. NUŠL má také spolupráci s několika mezinárodními systémy, které slouží k uchovávání šedé literatury. Přínosem těchto spoluprací je možnost přistupovat k šedé literatuře vydávané v České republice i v ze zahraničí.

Použité zdroje:

5 – Národní úložiště šedé literatury – Wikipedie. [online]. Dostupné z: https://cs.wikipedia.org/wiki/N%C3%A1rodn%C3%AD_%C3%BAlo%C5%BEi%C5%A1t%C4%9B_%C5%A1ed%C3%A9_literatury

8 – O repozitáři – Digitální repozitář. Národní úložiště šedé literatury – Digitální repozitář [online]. Dostupné z: http://invenio.nusl.cz/help/about?ln=cs

10 – Národní úložiště šedé literatury – Digitální repozitář. Národní úložiště šedé literatury – Digitální repozitář [online]. Dostupné z: http://invenio.nusl.cz/?ln=cs

11 – Národní úložiště šedé literatury – Digitální repozitář. Národní úložiště šedé literatury – Digitální repozitář [online]. Dostupné z: http://invenio.nusl.cz/?ln=cs&as=1

12 – Průvodce vyhledáváním – Digitální repozitář. Národní úložiště šedé literatury – Digitální repozitář [online]. Dostupné z: http://invenio.nusl.cz/help/search-guide?ln=cs

13 – Národní úložiště šedé literatury. Národní úložiště šedé literatury [online]. Dostupné z: https://nusl.cz

14 – Národní úložiště šedé literatury. Národní úložiště šedé literatury [online]. Dostupné z: https://nusl.cz/?language=cs&offset=0&zdroj=%C5%A0kolstv%C3%AD%2FVysok%C3%A9+%C5%A1koly%2F%C4%8Cesk%C3%A9+vysok%C3%A9+u%C4%8Den%C3%AD+technick%C3%A9+v+Praze&autor%5B%5D=N%C3%A1plava+Pavel

16 – Národní úložiště šedé literatury. Národní úložiště šedé literatury [online]. Dostupné z: https://nusl.cz/?language=cs&offset=0&zdroj=Kultura%2FKnihovny%2FN%C3%A1rodn%C3%AD+technick%C3%A1+knihovna&from=2015&to=2020

17 – Prostor jako služba – Digital Repository. Národní úložiště šedé literatury – Digitální repozitář [online]. Dostupné z: http://invenio.nusl.cz/record/410806/?ln=en

Arstor.org: Viac ako 3 milióny vizuálnych médií z oblasti kultúry, vedy, histórie a architektúry na jednom mieste.

Autor:

Peter Lichvar

-

14.3.2022

0

Úvod

Arstor je nezisková organizácia ktorá buduje a sprostredkuje virtuálnu databázu obrázkovych materiálov ktorá zprístupňuje takmer 3 milióny obrázkov a artefaktov,archívov a iných médií ktoré nenájdete k dispozícií na žiadnom inom online mieste. Táto databáza sa každý mesiac dynamicky rozrastá o státisíce nových objektov.

Hlavnou myšlienkou tohto repozitára je oživiť históriu, literatúru, náboženstvo a ďalšie humanitno-kultúrne odvetivia sprostredkovaním umeleckých obrazov, historických fotografií alebo virtuálnych diel. Tieto objekty nám tak pomáhajú lepšie porozumieť historií či spoločnosti a kompletne tak zefektívniť celý proces vzdelávania. Dalo by sa povedať, že Artsor zohráva úlohu pomyselnej virtuálnej knižnice, či múzea 2.0, v ktorom máte možnosť vidieť ľudskú históriu od praveku az po súčasnosť, a to jedným jediným klikom na jednej centralizovanej platforme. Ďalšou výhodou je fakt, že dané artefakty možno následne voľne používať bez strachu z porušovania vlastnických práv pod záštitou danej organizácie.

Pre koho je Arstor určený?

Táto digitálne knižnica je určená pre rôzne skupiny pedagógov, študentov ale aj širokú verejnosť ktorá prichádza s potrebou vyhľadávania kultúrno-spoločenských médií. Portál dokáže dopomôcť lepšie porozumieť rôznym disciplínam. Histórií je napríklad jednoznačne najlepšie porozumieť cez mapy a artefakty. Študenti literatúry zasa ocenia možnosť vizualizácie časov o ktorých čítajú alebo píšu. Rovnakým spôsobom môžu byť využívané zdroje Arstoru pedagógom, ktorý sa snaží študentom priblížiť novú látku. Nech už ide o akúkoľvek vednú disciplínu, databáza ponúka signifikantnú zbierku médií ktorá dodáva vzdelávaciemu procesu širokú škálu nových možností.

Ako používať Arstor?

Pokiaľ užívateľ na začiatok nepozná presný výraz, ktorý by rád vyhľadal, pomôže výber na podstránke artstor across discilplines. Na ľavom okne je užívateľovi ponúknutý nespočet konkrétnych tematických okruhov, ktoré ponúkajú priame presmerovanie na danú tému a pomáha tak nájsť užívateľovi potrebné média podľa konkrétnej témy. Táto podstránka následne ponúka aktuálne kolekcie, predvytvorené zbierky rovnakého kontextu, vyhľadávacie tipy, alebo aj všeobecné zaujímavosti a odkazy na blog k danej téme.

Výber z disciplín na portaly Arstro.org — Obrázok 1: Náhľad na výber z disciplín na portály Arstor.org. [zdroj obrázku: autor]

Artstor ponúka užívateľom rôzne funkcie pre efektívnu prácu s predvolenými ale aj vlastnými kolekciami. Poznáme celkom tri typy kolekcií. Public kolekcia je určená pre širšiu verejnosť, zatiaľ čo pre využívanie ostatných dvoch Core a Contribute kolekcií je potrebná registrácia užívateľa.

Arstor.org: Viac ako 3 milióny vizuálnych médií z oblasti kultúry, vedy, histórie a architektúry na jednom mieste. — Obrázok 2: *Úvodná stránka arstor.org a možnosti výberu kolekcií. [zdroj obrázku: autor]*

Možeme si teda prezerať rôzne kolekcie vytvorené k určitej téme, alebo si rovnako zgroupovať do zbierok vlastné obrázky podľa aktuálnej potreby tak, aby nám boli dostupné kedykoľvek a od kdekoľvek sa k portálu pripojíme.

Táto zbierka može predstavovať napríklad učebnú pomôcku pre študentov, ktorým možeme tieto kolekcie k hodinám sprístupniť. To prináša princíp znovupoužiteľnosti a priehľadnosti. Každy obrázok v zbierke má svoje originálne popisné vlastnosti. V týchto vlastnostiach nájdeme dôležité informácie o názve, autorovi, dátume kedy bol artefakt vytvorený ale taktiež napríklad odkaz na zdroj. Pri médiach rovnako pomôže dostupnosť nástroja pre automatické citácie s možnosťou voľby z rôznych štýlov citácií. Tento obrázok následne možeme stiahnuť a použiť pri našich offline prezentáciách. Pri prechádzaní našich online kolekcií je možné zbierky editovať- a to napríklad popiskom do ktorého možeme pridávať odkazy na ďalšie internetové zdroje a média, ktoré môžu študenti navštíviť.

Centralizovaná databáza umožňuje flexibilné zdieľanie učebného materiálu, online a cez link, ušetríme tak jednoducho čas hromadným rozosielaním. Pri sťahovaní sa pritom nemusíme obávať porušení vlastníckych práv na dané médium. Každý užívateľ totiž može používať artefakty podľa podmienok použitia portálu Arstor.

Obrázok 3: Náhľad obrázku v kolekcií. *[zdroj obrázku: https://www.svkos.cz/o-knihovne/aktuality/artstor-databaze-umeleckych-del]*

Medzi ďalšie výnimočné vlastnosti patrí možnosť detailnejšieho náhľadu diela. Používateľ si može kurzorom približovať a oddiaľovať každé dielo kolekcie do nejmenších detailov a získavať tak ďalšie potrebné informácie a zažívať celkovo lepší vizuálny zážitok.

Ďalšou možnosťou sú možnosti voľby módu present alebo study. Pri výbere study módu má študent možnosť prezerať zbierku obrázkov do vyššieho detailu. Na druhú stranu present mód predstavuje komparatívny nástroj pre porovnávanie dvoch rozdielnych artefaktov z rovnakej zbierky.

Záver

Arstor je portál ktorý ponúka veľmi bohatú databázu médií podporujúcu prevažne vzdelávaciu a sebarozvojovú činnosť a to nie len pre jednotlivcov ale aj pre celé skupiny. Všetky vizuálne média obsahujú najdôležitejšie informácie a odkazy na priame citácie. Tým ho možno považovať za pomerne jedinečný a bezpečný nástroj s množstvom priehľadných funkcií, ktoré može užívateľ použiť vždy vtedy, keď mu vznikne potreba naozaj relevantnej opory a zdroja z oblasti vizualizačných médií.

Zdroje:

1.https://www.artstor.org/

2. https://www.svkos.cz/o-knihovne/aktuality/artstor-databaze-umeleckych-del

3. https://www.youtube.com/watch?v=aXDM3TwiV3Y

4. https://www.youtube.com/watch?v=fK1nW2Zjg4s&t=53s

Obrázky:

Obr1. Náhľad na výber z disciplín na portály Arstor.org. [zdroj obrázku: auor]

Obr2. Úvodná stránka arstor.org a možnosti výberu kolekcií. [zdroj obrázku: autor]

Obr3. Náhľad obrázku v kolekcií. [zdroj obrázku: https://www.svkos.cz/o-knihovne/aktuality/artstor-databaze-umeleckych-del]

EZB: bibliografický poklad z Řezna pro všechny vědce. Indexováno je tu přes 100 tisíc titulů

Autor:

zalt02

-

11.3.2022

0

Úvod

V dnešní době existuje obrovské množství dat. Můžeme je získávat pohodlně na internetu, kde si můžeme vybrat až ze stovek vyhledávacích portálů či databází. Tento článek se zaměřuje na vědecké časopisy, které si jen tak v trafice nekoupíte. Mluvíme o knihovně elektronických časopisů známé pod zkratkou EZB. EZB je služba pomáhající vyhledávání a používání odborných časopisů na internetu. Nabízí velmi rychlé, uspořádané a celistvé rozhraní k získání plnotextových článků dostupných online. EZB je jednou z nejkomplexnějších volně dostupných bibliografických databází o akademických elektronických časopisech (Šťastná, Koštálová, 2020). V článku se prvně zaměříme na EZB, jak vznikla, a poté si ukážeme, jak lze v knihovně vyhledávat.

O EZB

Elektronická knihovna časopisů (EZB) byla založena v roce 1997 Univerzitní knihovnou v Regensburgu ve spolupráci s Univerzitní knihovnou Technische Universität München. EZB si klade za cíl nejen přehledně prezentovat e-časopisy uživatelům knihoven, ale také svým členským knihovnám slouží jako efektivní nástroj správy licencí e-časopisů. Momentálně EZB využívá na 660 uživatelských knihoven k propojení svých webových stránek s weby časopisů (Bauer, 2002).

Spolupráce mezi všemi členskými institucemi EZB umožňuje sběr spolehlivých přístupových dat k elektronickým časopisům a neustálé rozšiřování rozsáhlé sbírky časopisů s otevřeným přístupem. Díky kolektivní správě dat jsou informace v časopisech v EZB na vysoké úrovni a neustále aktuální (Bauer, 2002).

Obrázek 1 Logo EZB https://de.wikipedia.org/wiki/Elektronische_Zeitschriftenbibliothek#/media/Datei:Elektronische_Zeitschriftenbibliothek_(Logo).jpg

V roce 2021 nabídla EZB svým uživatelům dokonce metadata (název, vydavatel atd.) více než 108 000 časopisů. Každý z těchto datových záznamů časopisu obsahuje také hypertextový odkaz, který přesměruje přímo na webovou stránku požadovaného časopisu, kde si lze přečíst plné texty jednotlivých ročníků. Více než 72 000 ze 108 000 časopisů je online a zdarma ke čtení. Úplné texty zbývajících 36 000 jsou za poplatek, dostupné v těch knihovnách, které si dané vydavatele licencovala (Bauer, 2002).

Žádosti o zařazení časopisu do EZB lze podávat prostřednictvím domovské stránky. Kritéria pro zařazení jsou, že se jedná o vědecký časopis (na rozdíl od populárně vědeckých časopisů), že je přístupný celý text (na rozdíl od časopisů, které nabízejí pouze obsahy nebo abstrakty) a že plné texty jsou přístupné prostřednictvím World Wide Webu. EZB uvádí celé časopisy – naopak e-knihy, noviny, databáze a šedá literatura v EZB uvedeny nejsou. A kdo EZB používá? Především akademické knihovny, ale také konsorcia, výzkumné a další akademické instituce, jako jsou nemocnice (Bauer, 2002).

Přístupnost k časopisům z ČR

Konsorciální konto (ze kterého vstupujeme do EZB, pokud nevyužíváme už služeb zapojených institucí jako např. vybrané školy či knihovny) – slouží k aktivaci přístupů k plnotextovým časopisům knihoven v ČR, které spolupracují s EZB. Tyto knihovny, které spolupracují s ESB, mají aktivovány přístupy k těmto časopisům, takže pokud uživatel vstupuje do EZB z těchto partnerských institucí, dostane se k plným textům (Šťastná, Koštálová, 2018).

Mezi české instituce spolupracující s EZB patří následující:

EZB: bibliografický poklad z Řezna pro všechny vědce. Indexováno je tu přes 100 tisíc titulů — **Obrázek 2 Instituce s EZB v ČR**
http://ezb.nkp.cz/knihovny.htm

Obsah EZB

Obsahuje již na 109 759 titulů ze všech oblastí zkoumání a celkem 26 050 z nich je dostupných online. Kromě toho je uvedeno 138 280 časopisů, které poskytují agregátory. EZB obsahuje 73 535 časopisů, které jsou zdarma přístupné komukoli. Kromě toho zúčastněné knihovny poskytují svým uživatelům přístup k časopisům, které odebírají (EZB, nedatováno).

Časopisy se uživateli zobrazují v abecedním pořadí, i když může také omezit zobrazení na jednu z přibližně 40 tematických oblastí (např. vzdělávání). Kromě rychlého vyhledávání a možnosti rozšířeného vyhledávání si uživatel může zobrazit také časopisy nově přidané do EZB (EZB, nedatováno).

Datový záznam pro časopis obsahuje především bibliografické informace, jako je název, URL časopisu, ISSN, předmětové přiřazení, připojené ZDB číslo (=databáze časopisů), typ ceny (zdarma nebo za poplatek) a vydavatele. Klíčová slova se objevují v některých, ale ne ve všech záznamech (Bibliothek zum Mitnehmen, 2014).

Časopisy jsou prezentovány v seznamech seřazených podle oblastí výzkumu. Databáze generuje aktualizovaný seznam podle specifikací členské knihovny při každém přístupu (Šťastná, Koštálová, 2020).

Dostupnost fulltextového přístupu je označena semafory podle licenční situace každé členské knihovny:

Semafor je k dispozici celou dobu při každém vyhledávání. Je umístěn v pravém horním rohu stránky, tudíž je možné filtrovat dostupnost při každém vyhledávání.

Vyhledávání v EZB

Po vstupu do EZB, k dispozici následující odkaz: https://ezb.uni-regensburg.de/ezeit/about.phtml?bibid=CZS07&colors=7&lang=de), máme na výběr ze dvou jazyků – německého či anglického (v reportu bude dále využíván anglický jazyk).

Ne všechny instituce, které spolupracují s EZB, mají dostupné všechny tituly – záleží, jaké licence mají koupené. Proto se nabídka titulů liší instituce od instituce, přes kterou uživatel přichází.

Po zvolení námi preferovaného jazyka můžeme začít s vyhledáváním. EZB umožňuje vyhledávání:

1. podle předmětu časopisu,

2. podle názvu časopisu,

3. rozšířené vyhledávání.

Hledání časopisů podle předmětu

Seznam předmětů časopisů je rovnou na titulní stránce nebo ho najdeme vlevo v menu pod tlačítkem List by Subject, které nás také přivede k abecednímu seznamu předmětů/oborů. Vybereme například obor Education. Po rozkliknutí se objeví abecední seznam časopisů, které se věnují vzdělávání. Pro ukázku zvolíme např. časopis Academic Advising Today.

Po rozkliknutí titulu máme přístup k následujícím informacím:

1. Odkaz na čísla časopisů dostupná v plném textu.

2. Dostupné detaily o zvoleném časopise.

3. Webová stránka časopisu.

Hledání podle názvu časopisu

Na titulní straně vlevo v menu zvolíme List by Title, což nás přesměruje opět na abecední seznam časopisů. Od tohoto kroku je vyhledávání totožné jako u předchozího kroku (až na to, že jsou zahrnuty všechny obory časopisů).

Rozšířené vyhledávání

EZB také umožňuje rozšířené vyhledávání, to lze zvolit na titulní straně dvěma způsoby, a to v menu pod Journal Search nebo vedle rychlého vyhledávání pomocí Advanced Search.

Otevře se pokročilé vyhledávání, již v úvodu EZB nabízí odkaz na pomoc při vyhledávání a nejčastější dotazy uživatelů. Prvně se zaměříme na tu snazší část pokročilého vyhledávání, v obrázku (č. 12) označenou spodním zeleným obdélníkem. Tam lze filtrovat opět pomocí předmětu, množství námi vybraných předmětů není nijak omezeno.

Horní levá část vyhledávání dává na výběr z následujících kritérií (níže obrázek č. 13):

Slova v názvu,

Název začíná na…,

Klíčová slova,

Vydavatel,

ISSN,

Přidáno od,

Poslední změna,

ZBD-IB.

Napsáním jednoho či více slov do prostředního pole u filtru Titlewords lze získat všechny tituly obsahující tato slova. Pokud slova odpovídají přesnému názvu časopisu, tak se ukáže přesný výsledek. Lze také vyhledat přesný výraz či frázi vložením do uvozovek („“). Pravá část vyhledávání také nabízí využití logických operátorů AND, OR a AND NOT. Výrazy lze také seskupovat pomocí závorek (). Hledané výrazy nerozlišují malá a velká písmena. Pokud hledáme pod filtrem Added since – přidáno od, je nutné používat datum ve formátu den, měsíc, rok (EZB, nedatováno).

Závěr

EZB obsahuje obrovské množství vědeckých časopisů. Některé jsou dokonce dostupné bezplatně z pohodlí našeho domova, na jiné musíme využít partnerské instituce EZB. V databázi lze vyhledávat pohodlně podle titulů i předmětů, takže si každý může jednoduše zvolit svůj předmět zkoumání a pohodlně si vybrat. Dokonce EZB nabízí i rozšířené vyhledávání pomocí logických operátorů, za což dostává velké plus, neboť to výrazně usnadňuje práci při vyhledávání.

Použité zdroje:

Bibliothek zum Mitnehmen (Memento vom 26. September 2013 im Internet Archive), auf der Homepage der Universitätsbibliothek Regensburg abgerufen am 25. Mai 2014.

Bruno Bauer: EZB, Elektronische Zeitschriftenbibliothek. 10 Fragen von Bruno Bauer an Evelinde Hutzler, Projektverantwortliche für die EZB an der Universitätsbibliothek Regensburg, 2002, S. 28.

EZB, nedatováno. Journal List by Subject | Electronic Journals Library. Zeitschriftenliste nach Fachgebiet | Elektronische Zeitschriftenbibliothek [online]. Copyright © [cit. 09.02.2022]. Dostupné z: https://ezb.uni-regensburg.de/index.phtml?bibid=AAAAA&colors=5&lang=en

OCCRP Aleph: Staňte se investigativním reportérem

Autor:

Matouš Kurka

-

11.3.2022

0

Úvod

Organized Crime and Corruption Reporting Project (OCCRP) sdružuje investigativní reportéry zabývající se korupcí, praním špinavých peněz a ostatními druhy organizovaného zločinu. V rámci projektu jsou zveřejňovány články investigativních žurnalistů za účelem šíření informací o trestných činech a přivedení zúčastněných osob k odpovědnosti. Investigativním žurnalistům k těmto účelům slouží veřejně přístupná open source platforma OCCRP Aleph (dále pouze Aleph). (Aleph 2022a)

Platforma Aleph je veřejně přístupná, ale k významné části dat lze přistoupit pouze s žurnalistickou či akademickou/aktivistickou licencí. O licenci si lze zažádat u OCCRP. V rámci tohoto procesu je nutné vyplnit dotazník, který mj. vyžaduje odkazy na již existující publikace uchazeče. Jednotlivé žádosti jsou poté individuálně procházeny a vyhodnocovány. Jeden z faktorů při vyhodnocování je i to, jestli byl žadatel schopen se odkázat na člena OCCRP, který se za uchazeče zaručuje, či na předchozí spolupráce s OCCRP. OCCRP tímto způsobem chrání citlivá data proti zneužití a v případě, že by i přes tato opatření úspěšný uchazeč data následně zneužil, tak licence OCCRP anuluje. Více o licencích včetně formuláře lze nalézt na webové stránce platformy (viz Aleph 2022a).

Tento článek je psán na základě přístupu k platformě bez licence, ale obsah není ovlivněn, jelikož je pouze omezeno množství vyhledatelných souborů. Platforma je proto využitelná i pro běžné uživatele bez licence, pro účely sběru informací o entitách v rámci competitive intelligence.

Jaké soubory lze na platformě vyhledat

Tato kapitola vychází z informací o zdrojích v dokumentaci projektu (viz Aleph 2021e).

Aleph obsahuje strukturovaná i nestrukturovaná data, která umožňují uživatelům sledovat aktiva a vlastnictví společností i osob. Prakticky lze tedy i pro účely competitive intelligence na jednom místě prohledávat datasety, databáze a dokumenty se záznamy z rejstříků, novin, archivů, uniklých informací (leaks) či např. finančních záznamů o specifické osobě či firmě. Ve veřejně přístupné verzi platformy jsou k dispozici informace o 336 milionech institucí, lze prohledávat 259 datasetů a to vše v rámci 139 zemí a teritorií.

Uživatelé ale nejsou odkázáni pouze na již nahraná data, jelikož platforma umožňuje nahrávat vlastní soubory, např. PDF, Word dokumenty, ale i e-mailové komunikace a videonahrávky. Nahrávání souborů ulehčuje spolupráci a navíc umožňuje prohledávání platformy na základě extrahovaných informací z nahraných dokumentů. Platforma po nahrání dokumentu automaticky rozeznává a extrahuje jména lidí, názvy společností, telefonní čísla, adresy a IBAN, kterými následně nahrané soubory anotuje. Tento proces se nazývá tzv. named entity recognition (NER). Platforma anotuje i nascenované dokumenty ve formátu PDF. Aleph pro tento účel využívá OCR nástroje Tesseract 4 a Google Vison API. Více o NER a OCR implementaci v projektu lze nalézt v odpovídajících úsecích technické dokumentaci projektu (viz Aleph 2021d). Po tomto procesu následuje indexace dat do search enginu ElasticSearch (Aleph 2021a). Platforma takto umožňuje efektivní prohledávání dat pomocí klíčových slov jednotlivých souborů.

Vyhledávání na platformě

Tato kapitola vychází z informací o vyhledávání, které jsou k dispozici v technické dokumentaci projektu (viz Aleph 2021c).

Kromě vyhledávání dat pomocí klíčových slov z uživatelem nahraných souborů (viz předchozí kapitola Jaké soubory lze na platformě vyhledat) lze platformu prohledávat obvyklými způsoby pomocí vyhledávací lišty. Vyhledávací lišta navíc podporuje pokročilé vyhledávání. Uživatel tak může využívat operátory, které ovlivňují vyhledávání. Alternativně je k dispozici grafické rozhraní, přes které lze zjednodušeně pokročile vyhledávat.

Pokročilé vyhledávání pomocí vyhledávacích operátorů

Obrázek 1 Vyhledávací lišta. Zdroj: (Aleph 2022b)

Pozn.: Všechny uvozovky dále jsou horní uvozovky. V článku se kvůli limitaci WordPressu zobrazují i dolní uvozovky, ty ale ve vyhledávání nefungují.

Vybrané vyhledávací operátory, které lze ve vyhledávací liště využít:

Uvozovky (“”) pro vyhledání fráze. Tedy “OCCRP Aleph” vyhledá pouze soubory s celým názvem platformy v tomto slovosledu.
Operátor ~ pro vyhledávání variant. Pro vyhledání všech variant jména Hanna, lze vyhledat Hanna~1, kde číslo za ~ určuje počet písmen, která se ke jménu mohou přidat, odebrat, či ve jménu změnit. Tímto způsobem lze nalézt všechny záznamy, kde se vyskytuje kromě Hanna i Hannah, Hana, Hanka atp.
Operátor ~ slouží i pro vyhledávání kombinace slov v definovaném rozmezí. Pokud se vyhledá “Praha Brno”~15, tak se vyhledají všechny výsledky, ve kterých je mezi těmito městy rozdíl 15 či méně slov.
Operátor + lze využít, je-li vyžadováno, aby výsledek obsahoval dané slovo. Obdobně operátor -, pokud výsledek dané slovo obsahovat nesmí. +Praha -Brno vyhledá výsledky se slovem Praha, ale bez slova Brno.
Vyhledávací lišta podporuje booleovský operátory AND a OR. Místo operátoru AND Aleph používá klasickou mezeru. Praha Brno vrátí výsledky, kde musí být obě slova Praha a Brno. Praha OR Brno vrátí výsledek, kde je buď Praha, nebo Brno, či obě města.
Pro více pokročilé uživatele je zajímavá informace, že search engine platformy Aleph je ElasticSearch. Mnohé zde nezmíněné operátory tohoto enginu tak fungují i v Alephu. Návod pro funkce ElasticSearch (např. regulérní výrazy či fuzzy matching) lze nalézt v dokumentaci ElasticSearch (viz Elastic 2022).

Operátory lze také libovolně kombinovat.

Pokročilé vyhledávání pomocí grafického rozhraní

Box Advanced Search nahrazuje potřebu využívání operátorů. Lze se k němu dostat pomocí ikony filtrů, napravo od vyhledávací lišty.

OCCRP Aleph — Obrázek 2 Grafické rozhraní pokročilého filtrování. Zdroj: (Aleph 2022b)

All of these words vyhledává všechny výsledky, které obsahují všechny hledané výrazy.
Any of these words vyhledává všechny výsledky, které obsahují alespoň jeden z hledaných výrazů, nebo oba výrazy. Nahrazuje tak booleovský operátor OR.
None of these words vyhledává všechny výsledky, které neobsahují ani jeden z napsaných výrazů. Nahrazuje tak operátor -.
This exact word/phrase vyhledává všechny výsledky, které obsahují napsanou frázi. Nahrazuje tak uvozovky.
Spelling variations vyhledává variace hledaného slova, se specifikovaným maximálním množstvím možných pozměněných operátorů. Nahrazuje tak operátor ~(číslo).
Terms in proximity to each other vyhledává všechny výsledku, které obsahují hledaná slova s definovanou maximální vzdálenosti od sebe. Nahrazuje tak operátor ” “~(číslo).

Grafické rozhraní pro pokročilé vyhledávání přestavuje uživatelsky přívětivou možnost i pro běžnou veřejnost. Jedná se o dostatečné řešení pro většinu vyhledávání. V případě potřeby dalších možností úprav vyhledávání je ale nutné se vrátit k vyhledávání přímo ve vyhledávací liště za využití operátorů, které slouží k pokročilému vyhledávání v search enginu ElasticSearch.

Filtrování výsledků

Po vyhledání výsledků pomocí vyhledávací lišty lze výsledky filtrovat. Platforma umožňuje filtrovat podle typu souboru, jazyka, emailových adres, telefonních čísel, jmen a dalších. Platforma nabízí základní filtry, které lze vidět na obrázku 3.

OCCRP Aleph: Staňte se investigativním reportérem — Obrázek 3 Základní filtry. Zdroj: (Aleph 2022b)

Po rozkliknutí Configure filters lze filtrovat ve vysokém detailu, viz obrázek 4.

Výsledky lze také filtrovat pomocí časové osy. Na ní lze vidět rozložení výsledků v čase a umožňuje se tak zaměřit na specifický časový úsek, viz obrázek 5.

Exportování dat

Data lze kromě nahrávání na platformu i z platformy exportovat. Není tak vyžadováno zpracování souborů pouze v platformě, která umožňuje prohlížení souborů, ale je možné je zpracovávat v uživatelem preferovaném softwaru. Po nalezení výsledků je tak možné např. dataset exportovat do formátu xlsx a následně jej dále zpracovávat mimo platformu. Platforma extrahuje textové formáty jako plain text či HTML, Microsoft Office formáty, tabulární formáty jako csv, e-mailové formáty, balíčky jako ZIP a audiovizuální formáty jako JPEG či mp4.

Organizace výsledků

Aleph umožňuje tvorbu vlastního prostoru (investigation), ve kterém lze organizovat a následně vizualizovat výsledky, ať už pro účely investigativního vyšetřování, či průzkumu firem v rámci competitive intelligence. Jedná se o místo, kam lze soubory nahrávat a kde je lze upravovat a organizovat. Následně lze soubory vkládat do struktur a poté tvořit síťové diagramy. Jelikož platforma podporuje spolupráci, tak lze do pracovních prostorů zvát další členy.

Ukázkový pracovní prostor

Pracovní prostor je demonstrován na základě vyhledávání informací o firmě Madeta a. s. a následného zjišťování vazeb firmy na další subjekty. Po přihlášení se v pravém horním rohu zobrazuje tlačítko Investigations. Po otevření se zobrazuje možnost vytvoření nového pracovního prostoru.

Následně se uživateli zpřístupní pracovní prostor.

Do pracovního prostoru lze pomocí tlačítka Create new entitities vytvářet nové entity, které mají být součástí pracovního prostoru. Vytvoříme proto entitu Madeta a. s., která se následně přidá do seznamu firem v pracovním prostoru.

Po přidání nové entity lze rozkliknut položku Companies, ve které lze vidět firmu Madeta. K firmě lze přiřadit další údaje jako jurisdikce, datum založení a další.

Jelikož aktuálně nemáme k dispozici žádné další informace o hledané firmě, je nutné je nejprve na platformě vyhledat. Ve výsledcích na obrázku níže lze vidět, že lze přistoupit ke dvěma datasetům s informacemi o firmě a k dalším dvěma datasetům s informacemi o dotacích, ve kterých firma figuruje.

Po otevření datasetu s informacemi o firmě lze vidět organizační strukturu firmy.

Ing. Milan Teplý je předsedou představenstva firmy, kterého můžeme také zařadit do pracovního prostoru.

Po přidání nové entity lze rozkliknut položku People, ve které lze vidět Ing. Milana Teplého. K němu lze přiřadit další údaje jako národnost, datum narození, e-mail a další.

Jelikož jsme při hledání informací o firmě nalezli datasety s dotacemi (viz obrázek 10), můžeme je dále využít.

Po otevření výsledku zjišťujeme, že se jedná o dotace z Evropské unie. Jednotlivé dotace také obsahují odkazy na stažení datasetů, pomocí kterých lze datasety stáhnout a následně vložit do pracovního prostoru (viz kapitola Extrahování dat). Nejdříve přidáme Evropskou unii jako entitu.

Následně také nahrajeme dataset o dotacích, pomocí tlačítka Upload documents, aby byla všechna data na jednom místě.

Nahraný dokument je poté k dispozici pod tlačítkem Documents.

Jelikož je již součástí pracovního prostoru několik entit, lze je vizualizovat, pomocí tlačítka Sketch a network diagram.

Po vytvoření diagramu se otevře prostředí, ve kterém lze diagramy tvořit.

Pomocí tlačítka add entity v levém menu lze přidat dříve vytvořené entity. Tímto způsobem postupně přidáme všechny entity v pracovním prostoru.

Po přidání se objeví uzel pro každou přidanou entitu.

Každý uzel lze upravovat kosmeticky a také k němu lze přidávat dodatečné informace.

Pomocí tlačítka v levém menu lze mezi uzly přidávat vztahy, které se projevují linií mezi uzly. Ty lze obdobně jako u uzlu rozšiřovat o informace.

Ve výsledku poté vypadá základní vizualizace následovně. Ve grafu lze vidět, že Milan Teplý je předsedou firmy Madeta a. s., která čerpá dotace z Evropské unie. Pro podrobnější informace lze následně v pracovním prostoru otevřít dataset s dotacemi.

Závěr

Platforma OCCRP Aleph je unikátní platforma, která je využívána pro boj proti korupci, praní špinavých peněz a dalším zločinům. To vše v rámci veřejně přístupné open source platformy. Jedná se o užitečný nástroj nejen pro investigativní novináře, ale i běžné uživatele, kteří mohou využívat velké množství rejstříků a ostatních souborů na jednom místě, pro účely competitive intelligence. Platforma umožňuje uživatelům pokročilé vyhledávání a automatickou anotaci nahraných souborů. Aleph kromě vyhledávání informací umožňuje i tvorbu pracovních prostorů, které umožňují nalezené informace organizovat a následně vizualizovat.

Zdroje

ALEPH, 2021a. Advanced search. aleph [online] [vid. 2022-02-06]. Dostupné z: https://docs.alephdata.org/guide/search/advanced-search-methods
ALEPH, 2021b. Drawing network diagrams. aleph [online] [vid. 2022-02-06]. Dostupné z: https://docs.alephdata.org/guide/building-out-your-investigation/network-diagrams
ALEPH, 2021c. Searching your data. aleph [online] [vid. 2022-02-06]. Dostupné z: https://docs.alephdata.org/guide/search
ALEPH, 2021d. Technical FAQ. aleph [online] [vid. 2022-02-06]. Dostupné z: https://docs.alephdata.org/developers/technical-faq
ALEPH, 2021e. The building blocks of Aleph. aleph [online] [vid. 2022-02-06]. Dostupné z: https://docs.alephdata.org/guide/the-basics
ALEPH, 2022a. About OCCRP Aleph – OCCRP Aleph. OCCRP Aleph [online] [vid. 2022-02-06]. Dostupné z: https://aleph.occrp.org/pages/about
ALEPH, 2022b. OCCRP Aleph. OCCRP Aleph [online] [vid. 2022-02-06]. Dostupné z: https://aleph.occrp.org/
ELASTIC, 2022. Query string query. elastic [online] [vid. 2022-02-06]. Dostupné z: https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-query-string-query.html#query-string-syntax

SocialBearing – nástroj pro analýzu příspěvků na Twitteru

Autor:

xkudj22

-

9.3.2022

0

Twitter je podle Similarweb v České republice 3. nejnavštěvovanější sociální síť. [1] Na rozdíl od populárnějších sítí jako Facebook či Instagram jsou veřejné příspěvky na Twitteru dobře indexovány vyhledávači a i díky existenci API existují nástroje pro analýzu obsahu této sociální sítě mezi které patří i SocialBearing. Výhodou tohoto nástroje je široká funkcionalita i ve verzi zdarma, omezená pouze krátkou historií analyzovaného obsahu.

Možnosti vyhledávání

Nástroj SocialBearing umožňuje vyhledávání následujícího druhu obsahu:

příspěvky – tweety
příspěvky konkrétních veřejných uživatelských účtů
místa jak podle štítků tak “geo” informací
uživatelské účty podle klíčových slov a lokality
sledující veřejných účtů
přátele veřejných účtů.

Vyhledávat příspěvky je na rozdíl od ostatních vyhledávání možné i bez propojení s vlastním twitterovým účtem díky vyššímu limitu API dotazů, pojďme si ukázat příklad takovéhoto hledání.

SocialBearing - nástroj pro analýzu příspěvků na Twitteru — Obr. 1: Hlavní vyhledávací okno pro příspěvky Zdroj: socialbearing.com

V případě vyhledávání příspěvků má uživatel nejširší možnosti vyhledávání. Do hlavního vyhledávacího pole můžeme vložit buď klíčové slovo obsažené v příspěvku, hashtag nebo odkaz. Pod vyhledávacím polem máme možnost vyhledávat přesnou shodu a rozbalovací nabídku s pokročilým vyhledáváním. V pokročilém vyhledávání můžeme výsledky vyhledávání zpřesnit na základě i stáří příspěvku (ve verzi zdarma pouze v rozsahu posledních 7 dní), jazyka, autora i osoby označené v příspěvku nebo můžeme vyloučit určitá klíčová slova. Mezi další možnosti pokročilého vyhledávání patří omezení výsledků pouze na obrázky, odkazy, videa nebo na obsah pocházející pouze od ověřených účtů. Mezi velmi zajímavou funkcionalitu patří také možnost vyfiltrovat pouze příspěvky podle minimálního počtu like, retweetnutí či odpovědí.

Výsledky a filtrování

Zde je příklad vyhledávání klíčového slova škoda. Jazyk příspěvků byl omezen na angličtinu.

V postranním panelu můžeme výsledky filtrovat podle druhu příspěvku, sentimentu, jazyka, počtu retweetů, liků, engagementu, počtu followerů, dosahu, podle autora nebo obsažených slov, hashtagů, zmínek, domén, url, zdroje či lokality.
Výsledek vyhledávání načte 100 nejnovějších příspěvků, kliknutím na load more je možné opakovaně načítat další příspěvky.
V horní části dashboardu vidíme agregované metriky pro všechny tweety: odhadovaný dosah, odhadovaný počet zobrazení, počet retweetnutí, počet like a počet odpovědí.

V dolní části vidíme koláčové grafy rozdělení tweetů podle sentimentu, druhu, zdroje a jazyka. Dále vidíme nejsdílenější domény, časovou osu příspěvků (u free verze posledních 7 dnů) a word cloudy hashtagů a všech slov. Příspěvky podle zemí a nakonec samotné příspěvky které můžeme třídit podle nejrůznějších kritérií jako například počtu retweetů, liků nebo engagementu.

Závěr

Přestože se Twitter v České republice netěší takové oblibě jako v zahraničí, může analýza jeho obsahu přinést cenné informace. Je však třeba vzít v potaz, že kvůli relativně nízké popularitě Twitteru se můžeme v případě mnoha klíčových slov potýkat s nedostatkem obsahu.

Použité zdroje:

Top social networks and online communities websites ranking in Czech Republic in January 2022. Similarweb [online]. [Accessed 11 February 2022]. Available from: https://www.similarweb.com/top-websites/czech-republic/category/computers-electronics-and-technology/social-networks-and-online-communities/

Použité obrázky:

Obr. 1: Hlavní vyhledávací okno pro příspěvky Zdroj: socialbearing.com

Obr. 2: Výsledek vyhledávání příspěvků Zdroj: socialbearing.com

ProQuest eBook Central: Digitální knihovna s širokým záběrem

Autor:

Filip Kopecký

-

7.3.2022

0

Úvodní představení

Společnost ProQuest podporuje výzkum, informační a knihovnické služby po celém světě (ProQuest LLC, 2022). V roce 2021 ji koupila společnost Clarivate s cílem vytvořit nejvýznamnější vědeckou a výzkumnou databázi díky propojení s jejich portálem Web of Science (Milliot & Albanese, 2021). V portfoliu ProQuest je například známý rešeršní portál ProQuest Central, a také další platformy, databáze a technologie, které pomáhají zpřístupňovat informace a znalosti. Jednou z nich je i digitální knihovna ProQuest eBook Central, jejíž slogan zní „Odborné elektronické knihy na dosah ruky“. ProQuest eBook Central v závislosti na typu předplatného nabízí více než 1,8 milionu digitálních titulů z široké palety oborů (ProQuest LLC, 2021a). Nabídka zahrnuje odborné knihy z vědeckých zdrojů, z univerzitních nakladatelstvích i od špičkových vydavatelů. Do systému se dostanete z řady krajských, či univerzitních knihoven, nebo třeba Národní technické knihovny. Samozřejmě vzdáleně z domova.

Úvodní stránka nabízí základní přehled a okno pro rychlé vyhledávání.

ProQuest eBook Central web: Úvodní stránka — Obrázek 1: Úvodní stránka (zdroj: ProQuest eBook Central web, autorův printscreen)

První karta ukazuje původce přístupu (v tomto případě je to Knihovna VŠE v Praze). Ten lze získat přes instituci, která má do ProQuest eBook Central zakoupen přístup (knihovna, univerzita, vědecký ústav,…).

Druhá karta je prohlášení o technické přístupnosti. Ten lze shrnout do konstatování, že ProQuest pracuje na zajištění a udržení dostupnosti knih a kvalitních možnostech čtení napříč různými zařízeními, internetovými prohlížeči či operačními systémy. Knihy jsou dostupné ve formátu EPUB a PDF a lze je číst on-line i off-line.

Nejdůležitější bod tohoto prohlášení je rozdělení titulů podle restrikcí stahování.

Knihy bez restrikcí stahování (DRM-free). V rámci denních limitů je možné stahovat obsah (celé knihy či jejich kapitoly) a dále ho kopírovat. Pokud u daného titulu nejsou restrikce stahování je označen následující větou “There are no copy, print, or download restrictions on this title.” a je možné stahovat dle nabídky. (ProQuest LLC, 2021b)
Knihy s restrikcemi stahování (DRM). Některé tituly však volně stahovat nelze, kvůli právům autorů a vydavatelů. Lze si je však na určitou dobu zapůjčit. A to přes službu Adobe Digital Editions, která umožňuje digitální zapůjčení knihy (tj. její plné zpřístupnění na omezenou dobu). (ProQuest LLC, 2021b)

Rešeršní možnosti

Rychlé vyhledávací okno poskytuje možnost ihned zadávat klíčová slova pro vyhledávání. ProQuest eBook Central podporuje známé a velmi rozšířené operátory (ProQuest LLC, b.r.):

“” | Anglické uvozovky pro přesné znění slov a slovních spojení.
AND (též pouze mezera) | Pro průnik výrazů ve výsledcích, tedy podmínku najít všechny výrazy zároveň.
OR |Pro možnost zobrazit výsledky s alespoň jedním z výrazů, nikoli však nutně se všemi.
NOT | Pro vyloučení některých výrazů.

Pro náročnější dotazy je však pohodlnější použít Rozšířené vyhledávání. Tato sekce umožnuje přehledně zadávat požadavky pro vyhledávání, a to v těchto kritérií: Klíčová slova & Fulltext, název knihy, název edice, autor, vydavatel, ISBN, BISAC Code, BISAC Subject Heading, Deskriptor Kongresové knihovny, Signatura Kongresové knihovny, Deweyho desetinné třídění, Ebook Central Obor (ProQuest LLC, b.r.).

U všech těchto polí lze zvolit možnost „obsahuje“ pro běžnou shodu nebo „rovnat se“ pro přesné znění (tato volba se aplikuje na celý obsah vyhledávacího okna). Je důležité mít na paměti, že systém automaticky mezi jednotlivá pole dává logickou spojku „AND“. Je tedy potřeba používat operátory v rámci jednotlivých polí. Po spuštění vyhledávání vám ProQuest eBook Central zobrazí hledaný výraz pomocí logických spojek, je výhodné si ho zkontrolovat, jestli je daná syntaxe v pořádku (více níže v Příkladu využití).

ProQuest eBook Central: Rozšířené vyhledávání — Obrázek 2: Přehled všech možností rozšířeného vyhledávání (zdroj: ProQuest eBook Central web, autorův printscreen)

ProQuest eBook Central v rozšířeném vyhledávání nabízí i další upřesnění, a to konkrétně: časový interval pro rok vydání, jazyk(y), formát (v jakém je titul dostupný), dostupnost titulu vzhledem k jeho restrikcím stahování a digitální sbírka.

Na další kartě (Prohlížet obory) je možné podívat se na e-knihy pode oborů. Je to zároveň hezký přehled toho, co všechno ProQuest eBook Central nabízí a jak široký má záběr: od umění, přes společenské vědy a filozofii až po přírodní vědy.

ProQuest eBook Central: Obory — Obrázek 3: Přehled oborů ProQuest eBook Central (zdroj: ProQuest eBook Central web, autorův printscreen)

Příklad využití

S množstvím titulů i témat, která ProQuest eBook Central nabízí, může být těžké si poradit a vše si správně utřídit. K čemu jsou statisíce e-knih z desítek oborů, když se v záplavě znalostí člověk ztratí. Naštěstí i s tímto problém si lze pomocí knih poradit. V příkladu použití bude za cíl nalézt knihy, které pomohou uživateli efektivně abstrahovat informace z nalezených a přečtených knih. Tímto se zabývá multioborová disciplína nazývaná personal knowledge management, lze také nalézt personal knowledge system. Proto v Rozšířeném vyhledávání byly zadány výrazy následovně s omezím pouze na angličtinu.

ProQuest eBook Central: Digitální knihovna s širokým záběrem — Obrázek 4: Ukázka vyhledávání (zdroj: ProQuest eBook Central web, autorův printscreen)

Jak bylo zmíněno výše, systém sám přepsal zadané vyhledávání pomocí vyhledávacích operátů. Lze jej zkopírovat a upravit dle požadavků, pokud by Rozšířené vyhledávání nebylo vyhovující a uživatel raději píše dotazy pro hledání tímto způsobem. V liště lze vidět všechny nabízené možnosti, jak vyhledání zpřesnit. Což by bylo vhodné, protože výsledkem hledání je 21 200 titulů.

Mnoho výsledků se zabývá organizačním pohledem a řeší, jak předávat znalosti v rámci organizací. Bylo by dobré u oborů (tedy u kritéria BISAC SUBJECT HEADINGS) vynechat ty, které nejsou relevantní. Bohužel v rámci tohoto kritéria nefunguje operátor NOT, nelze tedy například vynechat všechny knihy, které mají BISAC SUBJECT HEADINGS „Business & economics“. Proto je dobré výraz zpřesnit a vynechat slova, která jsou nežádoucí. Výsledkem už je pouze 29 titulů, z čehož už se dá rozumět vybrat.

Další velmi silnou stránkou je také fulltextové vyhledávání přímo v rámci knihy. Při čtení on-line můžeme rychle vyhledat požadovaný výraz a podívat se kde se v knize nachází. Z předchozího vyhledávání byla vybrána relevantní kniha. Po kliknutí na Číst online, můžeme knihu číst a hledat v ní požadované výrazy.

Závěr

ProQuest eBook Central představuje potenciál moderních knihovnických služeb a dostupnosti znalostí, jež byl ještě donedávna možná spíše skrytý a nevyužitý. Uplynulé dva pandemické roky výrazně urychlily digitalizaci v mnoha oborech a dostaly podobné platformy do většího povědomí. ProQuest eBook Central díky tematickému záběru a rešeršním možnostem výrazně přispívá k rychlejšímu rozvoji dostupnosti knih.

Jeho možnosti ocení studenti shánějící literaturu k výuce či psaní seminárních nebo závěrečných prací. Velkým pomocníkem je i pro akademické a vědecké pracovníky. Nicméně skvěle může posloužit komukoli, kdo se chce vzdělávat nebo jenom číst mnoho knih v elektronické podobě.

Použité zdroje

Milliot, J., & Albanese, A. (2021, květen 17). Clarivate to Buy ProQuest for $5.3 Billion. Získáno 8. únor 2022, z PublishersWeekly.com website: https://www.publishersweekly.com/pw/by-topic/industry-news/industry-deals/article/86387-clarivate-to-buy-proquest-for-5-3-billion.html

ProQuest LLC. (2021a). Ebook Central Brochure. Získáno z https://about.proquest.com/globalassets/proquest/files/pdf-files/brochures/ebookcentral-brochure.pdf

ProQuest LLC. (2021b, červen 10). Accessibility Statement: Ebook Central. Získáno 10. únor 2022, z https://support.proquest.com/s/article/Accessibility-Statement-Ebook-Central?language=en_US

ProQuest LLC. (2022). Who We Are. Získáno 8. únor 2022, z https://about.proquest.com/en/about/who-we-are/

ProQuest LLC. (b.r.). ProQuest Ebook Central. Získáno 11. únor 2022, z Důvěryhodné elektronické knihy z vědeckých zdrojů. website: https://ebookcentral.proquest.com/lib/vsep/search.action

Seznam obrázků

Obrázek 1: Úvodní stránka (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 2: Přehled všech možností rozšířeného vyhledávání (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 3: Přehled oborů ProQuest eBook Central (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 4: Ukázka vyhledávání (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 5: Ukázka vyhledávání 2 (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 6: Ukázka vyhledávání 3 (zdroj: ProQuest eBook Central web, autorův printscreen)
Obrázek 7: Ukázka prohlížení knihy (zdroj: ProQuest eBook Central web, autorův printscreen)