Úterý, 16 září, 2025
Domů Blog Stránka 15

ChemSpider: 100 milionů chemických sloučenin na jednom místě

0
round clear glass on white paper

Úvod

V dnešní době moderních technologií chemici a zdravotníci potřebují rychlý, spolehlivý a srozumitelný datový zdroj, který jim poskytne kompletní informace o chemických sloučeninách a jejich vlastnostech. Díky propojení moderních technologií a vědy vznikají databáze, umožňující snadné vyhledávání mezi miliony různorodých struktur.

Seznamení s ChemSpider

Jednou z těchto databází je ChemSpider, kterou vlastní britské Royal Society of Chemistry. Databáze obsahuje záznamy o více než 100 milionů chemických sloučenin, včetně lečiv. Na obrázku 1 je zobrazena domovská stránka portálu.

ChemSpider má několik klíčových misí:

  • Portál agreguje komplexní data z různých zdrojů a umožňuje snadné vyhledávaní s doplňujícími funkcemi (např. validace a propojení se synonymy pro zvýšení přesnosti výsledků hledání).
  • Zvýšení kvality volně přístupných zdrojů díky možnosti komentování a úprav (tzv. crowdsourced curation s expertním posouzením).
  • Poskytnutí jednotné platformy, kde můžou uživatelé sdílet i vlastní chemické struktury nebo jejich návrhy. Zároveň je možnost sdílení audiozáznamů, videí, odkazů atd.
  • Zajištění kvalitního UI a UX pomocí adaptivního rozložení stránek a integrace s jinými servisy.
  • Integrace s publikacemi z Google Scholar, PubMed a knihovnou Royal Society of Chemistry.
Obrázek 1. Domovská stránka ChemSpider (zdroj: autorka)




Obrázek 1. Domovská stránka ChemSpider (zdroj: autorka)

Uživatelé portálu se můžou podílet na jeho vývoji, a to díky sdílení vlastních datových sad, struktur či syntéz. Také mohou uživatelé „dohlížet“ data pro zajištění jejich přesnosti a relevantnosti.

Vyhledávácí možnosti

ChemSpider nabízí uživatelům 3 vyhledávácí typy:

Simple (Jednoduchý),

Structure (Strukturální),

Advanced (Pokročilý).

Simple

Jednoduchá verze vyhledávače nabízí několik variant hledání, např. pomocí obchodního názvu látky či systematického názvu (viz obrázek 2).

Obrázek 2. Vyhledávač portálu ChemSpider (zdroj: autorka)
Obrázek 2. Vyhledávač portálu ChemSpider (zdroj: autorka)

Podívejme se na možnosti vyhledávače na příkladu morfinu (viz obrázek 3). Zobrazí se stránka s výsledkem hledání, která obsahuje nejdůležitější informace o zadané látce: molekulový vzorec, atomová hmotnost a také ID sloučeniny v databázi ChemSpider. Po rozkliknutí tlačítka „More details“ ukazují se detailnější informace, např. celý systematický název a zjednodušená molekulární specifikace SMILES. O blok níže můžeme pozorovat přiřazení ke skupině látek – v případě s morfinem je to skupina opioidních analgetiků.

Obrázek 3. Výsledky jednoduchého vyhledávání (zdroj: autorka)
Obrázek 3. Výsledky jednoduchého vyhledávání (zdroj: autorka)

Níže se zobrazuje několik záložek s podrobnějšími informacemi, jakož jsou například synonymické názvy látky (všimněme si různých písem – některé jsou ověřené experty, jiné ověřují uživatelé atd.) Zajímavé informace obsahuje záložka Properties: teplota tání látky, její jedovatost, chemickou klasifikaci atd. (viz obrázek 4).

Obrázek 4. Ukázka záložek s doplňujícími informacemi o hledané látce (zdroj: autorka)
Obrázek 4. Ukázka záložek s doplňujícími informacemi o hledané látce (zdroj: autorka)

Structure

Strukturální vyhledávání je způsob, kdy na plátno se „vykreslují“ potřebné chemické vazby nebo atomy prvků periodické tabulky. Můžeme tam přidat např. různé typy vazeb (jednoduchou, dvojnou, aromatickou,…), benzenové jádro či atom kyslíku (viz obrázek 5). Po tom, co vykreslíme potřebnou strukturu, jsou na výběr několik možností filtrování výsledků – např. nalezení úplné shody, pouze single- nebo multikomponentových struktur atd. Po nastavení potřebných filtrů se zobrazí výsledek – v daném případě informace o benzenu (obrázek 6).

Obrázek 5. Vykreslení benzenového jádra na plátně (zdroj: autorka)
Obrázek 5. Vykreslení benzenového jádra na plátně (zdroj: autorka)
Obrázek 6. Výsledky strukturálního vyhledávání (zdroj: autorka)
Obrázek 6. Výsledky strukturálního vyhledávání (zdroj: autorka)

Advanced

Pokročilé vyhledávání umožňuje získat informace podle přesnějších parametrů, jakož jsou například podle atomové hmotnosti, výběru z periodické tabulky, datového zdroje atd. (obrázek 7).

Obrázek 7. Parametry pokročilého vyhledávání (zdroj: autorka)
Obrázek 7. Parametry pokročilého vyhledávání (zdroj: autorka)

Pokud zvolíme některé elementy v tabulce (např. skupinu „C H N O P S“ a skupinu „Li Na K Ca Zn Fe Cu Co Ni“ – viz obrázky 8 a 9) a začneme vyhledávání, výsledky se vypíšou do seznamu sloučenin, které obsahují tyto elementy (obrázek 10).

Obrázek 8. Výběr první skupiny elementů (zdroj: autorka)
Obrázek 8. Výběr první skupiny elementů (zdroj: autorka)
Obrázek 9. Výběr druhé skupiny elementů (zdroj: autorka)
Obrázek 9. Výběr druhé skupiny elementů (zdroj: autorka)
Obrázek 10. Výsledky pokročilého vyhledávání (zdroj: autorka)
Obrázek 10. Výsledky pokročilého vyhledávání (zdroj: autorka)

Závěr

ChemSpider je výborným nástrojem, který umožňuje solidní vyhledávání mezi sty zdrojů a může výrazně pomoci a usnadnit práci chemiků, zdravotníků i studentů. Díky kooperace s odborníky je tento zdroj důvěryhodný, nicméně se na vývoji portálu mohou podílet i běžní uživatelé. Taková spolupráce pomůže k rychlejšímu nalezení případných chyb a celkovému rozvoji.

Zdroje

[1] ChemSpider | Search and share chemistry. ChemSpider | Search and share chemistry [online]. Copyright © Royal Society of Chemistry 2022 [cit. 11.02.2022]. Dostupné z: http://www.chemspider.com/

Seznam obrázků

Obrázek 1. Domovská stránka ChemSpider (zdroj: autorka)

Obrázek 2. Vyhledávač portálu ChemSpider (zdroj: autorka)

Obrázek 3. Výsledky jednoduchého vyhledávání (zdroj: autorka)

Obrázek 4. Ukázka záložek s doplňujícími informacemi o hledané látce (zdroj: autorka)

Obrázek 5. Vykreslení benzenového jádra na plátně (zdroj: autorka)

Obrázek 6. Výsledky strukturálního vyhledávání (zdroj: autorka)

Obrázek 7. Parametry pokročilého vyhledávání (zdroj: autorka)

Obrázek 8. Výběr první skupiny elementů (zdroj: autorka)

Obrázek 9. Výběr druhé skupiny elementů (zdroj: autorka)

Obrázek 10. Výsledky pokročilého vyhledávání (zdroj: autorka)

ČSN Online – Databáze českých technických norem

0
white standard LED signage mounted on wall

Úvodní představení

Tento článek by měl začít citátem: „Kdo má informace, má moc“. Toto slovní spojení jistě už každý z nás někdy slyšel. Já bych si jej dovolil poupravit na „Kdo má informace a umí je využít, ten má moc“. Důvodů by se našlo více, ale jako jeden z hlavních vidím ten, že v dnešní době máme široký přístup k informacím, jinými slovy, může je mít každý. Čímž mě tato skutečnost vede k tomu, že je to o tom, jak ty informace umíme využívat než jen o tom, že k nim máme volný přístup.

ČSN Online

ČSN online zpřístupňuje kromě platných norem ČSN, jak je patrné z názvu, také i neplatné, které jsou digitalizovány. Systém nabízí tři možnosti, jak na jejich webu vyhledávat.

Vyhledávání v normách

První možný způsob, jak vyhledávat na ČSN online je přes tento podrobný formulář, který vidíte na přiloženém obrázku. Máte zde možnost filtrace normy, jestli se jedná o normu planou či neplatnou. Pokud si nejsme jistí, vybereme možnost, která zahrne obě varianty, avšak vyhledávání bude o to méně přesné. Do pole označení normy máme možnost vyplnit námi hledanou normu. Můžeme tak učinit s ale i bez zkratky „ČSN“. Pokud známe přesné označení námi hledané normy, zaškrtneme pole přesné označení. Pokud toto pole nezaškrtneme, bude se vyhledávat všechny normy, které svým počátkem názvu budou taktéž odpovídat. Je to lepší varianta, když si pamatujeme jen počátek označení normy, či chceme hledat nějakou skupinu norem. Třídící znak nám právě pomáhá při hledání skupin norem. Můžeme zapsat dvě, čtyři nebo celých šest číslic. Opět záleží, jak moc přesné chceme, aby vyhledávání bylo. První varianta pokrývá třídu, druhá pak skupinu v rámci zmíněné třídy. Poslední nejdelší varianta ještě obsahuje pořadí. Stránka umožňuje zadat více třídících znaků, které jen oddělíme čárkou. Dále následuje zadání českého názvu. Toto pole je nepovinné, když jej nevyplníme, nebude mít na výsledek vliv. Nutno podotknout, že tato možnost nerozlišuje velká a malá písmena, avšak diakritiku rozpoznává. Je možnost zadat více slov, tentokrát se oddělují mezerou. Zadání anglického názvu se chová naprosto identicky, jako zadání českého. Je nepovinné, slova se dělí mezerou a je opět nepovinné. Věstník vydání je odkaz na Věstník ÚNMZ a jeho konkrétní rok a měsíc vydání. Pokud tuto informaci o naší normě máme. Zapracovaná norma se používá při znalosti originální normy. Opět je možnost zadat její celý znění nebo pouze část, kterou si pamatujeme. V druhém případě dostaneme všechny normy, které mají shodný počátek námi zadaného výrazu do tohoto pole. Nezáleží na velikosti písmen, a dokonce ani na počet mezer. Zajímavostí je, že při použití této možnosti je vyplnění ostatních kritérií ignorováno, pouze třídění výstupních informací je bráno v potaz. Katalogové číslo je další možnost zpřesnění vyhledávání, je však důležité znát jeho přesnou hodnotu. ICS kód není záležitostí pouze českých norem, ale je mezinárodní. Při jeho nevyplnění, nebude na něj brát zřetel, je tedy nepovinné. Má tři kolonky, každá z nich reprezentuje jednu úroveň. První úroveň slouží pro dvě číslice, druhá úroveň pro tři číslice a poslední třetí úroveň pro dvě číslice. Jelikož se jedná o úrovně, je logické, že můžeme vyplnit buď jednu, první dvě nebo všechny tři. Jinými slovy, nemůžeme vyplnit třeba jen třetí úroveň. Šikovné je tlačítko výběr ISC kódů, které nám usnadní práci, při hledání správného kódu. Na úplný závěr vybereme, zdali chceme výsledky třídit podle třídícího znaku nebo podle označení norem.

čsn online vyhledávání v normách
Obrázek 1: Podrobné vyhledávání v normách. [zdroj obrázku: https://csnonline.agentura-cas.cz/vyhledavani.aspx]

Vyhledávání v TNI

Druhý možný způsob vyhledávání na webu ČSN online, je přes TNI. Přecházíme rovnou k označení TNI, která má úplně stejná pravidla a funkci, jak při zadávání označení normy u první možnosti vyhledávání. Stejně je tomu i pro třídící znak. Zajímavější je jiné zpracování slova z názvu. Nyní si musíme vybrat, jestli chceme vyhledávat podle českého názvu či podle anglického. Další změna je možnost výběru operátoru AND a OR.  AND operátor se chová jako násobení, tzn. zobrazí se jen ty výsledky, které splňují všechna námi zadaná slova. Naproti tomu OR je jako sčítání, tzn. zobrazí všechny výsledky, které mají, byť jen jednu shodu v námi zadaných slovech. Ostatní pravidla jsou stejná, nerozlišuje diakritiku či velká a malá písmena. Zapracovaná norma, katalogové číslo a ICS kód taktéž fungují stejně, jako u první možnosti vyhledávání norem. Klíčová slova jsou však novinkou. Název je vše vypovídající, co zde budeme zadávat. Klíčových slov můžeme zadat více, musíme je oddělit středníkem. Toto pole funguje na principu AND, tedy ukáže výsledky, které obsahují všechna námi zadaná klíčová slova. Třídění vybíráme mezi třídícím znakem nebo označením TNI. Nyní až na úplném konci vybereme, zdali chceme pouze platné, pouze neplatné či obě kategorie norem.

Obrázek 2: Podrobné vyhledávání v TNI. [zdroj obrázku: https://csnonline.agentura-cas.cz/tni.aspx]

Vyhledávání v produktech, názvech a označeních

Tato poslední třetí možnost vyhledávání na webu ČSN online je ze všech nejjednodušší, ale také nejméně přesná. Zde pouze zadáme slovo z názvu normy nebo označení normy. Je praktické, když neznáme mnoho informací o naší hledané normě nebo zkrátka chceme získat hodně výsledků.

Obrázek 3: Rychlé vyhledávání. [zdroj: https://csnonline.agentura-cas.cz/rychle.aspx]

Závěr

ČSN online je online prostředí, které shromažďuje nejen české normy. Přes jejich propracovaný vyhledávací formuláře lze vždy dohledat to, co požadujeme. Tyto normy však nejsou zdarma, je nutno za ně platit. Platí se za počet uživatelů a dobu tohoto přístupu k těmto normám. Pokud chce uživatel upgradovat zakoupenou licenci, předchozí se neprodlužuje a nezávisle na zbývající době předchozí se vždy platí plná sazba.

Zdroje

csnonline.agentura-cas.cz – ČSN online pro jednotlivce [online]. [cit. 11.02.2022]. Dostupné z: https://csnonline.agentura-cas.cz/default.aspx

Seznam obrázků

  • Obrázek 1: Podrobné vyhledávání v normách. [zdroj obrázku: https://csnonline.agentura-cas.cz/vyhledavani.aspx]
  • Obrázek 2: Podrobné vyhledávání v TNI. [zdroj obrázku: https://csnonline.agentura-cas.cz/tni.aspx]
  • Obrázek 3: Rychlé vyhledávání. [zdroj: https://csnonline.agentura-cas.cz/rychle.aspx]

Na Twitteru přehledně pomocí Twitter Advanced Search

0
blue and white heart illustration

Twitter je sociální síť fungující na principu mikroblogu. Ve většině případů se skládá z veřejných profilů, příspěvků a komentářů. Registrovaný uživatel tak může příspěvky nejenom číst, ale může na ně reagovat lajkem nebo komentářem, případně může příspěvek retweetnout, v překladu můžeme říci přesdílet, svým sledujícím i s možností případného komentování retweetovaného příspěvku.

Twitter příspěvek
Obrázek 1-Příklad twitterového příspěvku, zdroj: [4], autor: autor

K roku 5.1.2022 hlásí Twitter 396.5 milionů uživatelů z nichž 206 milionů navštěvuje síť každý den. Příspěvky mají omezenou délku na 280 znaků, uživatel má však možnost napsat delší příspěvek pomocí služby TwitLonger a následně sdílet text na svém twitterovém účtu.

V dnešní době Twitter využívá většina státních institucí z celého světa, sportovní organizace, politické i kulturní osobnosti a tak bychom mohli ve výčtu pokračovat. To však v dnešní době může způsobit i různé problémy v podobě falešných profilů, které mohou šířit falešné zprávy nebo jen opačné názory než člověk, za kterého se vydávají, proto má i Twitter implemetovanou funkci takzvaného checkmarku. Checkmark je označení pravého profilu a vím tak, že účet patří skutečné osobě či organizaci, za kterou se vydává.

Obrázek 2 – Oveřený profil, zdroj: [4], autor: autor

Twitter Advanced Search a jeho možnosti

Pro základní vyhledávání v sociální síti slouží klasický vyhledávač, který splní svoji funkcionalitu při používání běžnými uživateli. Nabízí základní filtry v podobě top, nedávných příspěvků, účtů, obrázků a videí.

Obrázek 3- Základní vyhledávání, zdroj: [4], autor: autor

Tyto základní možnosti však nejsou vše, dle čeho můžeme filtrovat naše vyhledávání. Za použití funkcí, označovaných jako součást vyhledávací nadstavby Twitter Advanced Search, máme možnost dohledat jakýkoliv příspěvek na základě různých parametrů filtru. Rozšířené vyhledávání je velice jednoduché a má vlastní interface do kterého uživatel zadá vlastní parametry. Zkušenější uživatelé si vystačí s klasickým vyhledávacím oknem a fráze pouze doplní o filtrovací znaky/operátory. Na rozšířené vyhledávání se dostaneme pomocí nabídky možností vpravo od vyhledávacího okna(viz obrázek 4).

Obrázek 4 – Přechod na rozšířené vyhledávání, zdroj: [4], autor: autor

Hledání na základě klíčových slov

Rozšířené vyhledávaní má vlastní interface, který umožňuje i nezkušeným uživatelům využívat tyto pokročilé funkce. Pro časté používání je však zbytečné rozepisovat svůj dotaz do mnoha polí a místo této funkce může uživatel použít základní vyhledávací pole a operátory, které se mohou vzájemně kombinovat.

Obrázek 5 – Interface rozšířeného vyhledávání, zdroj: [4], autor: autor

Všechna slova

První pole All of these words představuje standardní funkci vyhledávače a při zadání určitých slov vyhledá příspěvky obsahující tato slova v jakémkoli pořadí.

Přesná fráze

Jak již název filtru napovídá, tak nám budou vyhledány pouze příspěvky obsahující přesně zadaný termín. Využití si můžeme demonstrovat na případu vyhledávání příspěvků, které se obsahují slovo káva a zároveň frázi příjemná obsluha

Obrázek 6 – Přesná fráze, zdroj: [4], autor: autor

Některé ze slov

Jednoduchý filtr, který funguje jako a představuje logický operátor OR, české nebo. Například vyhledávací fráze (rychlý OR pomalý) internet zobrazí veškeré příspěvky, které obsahují slovo internet a rychlý nebo pomalý(viz obrázek 7)

Obrázek 7- Některé ze slov, zdroj: [4], autor: autor

Žádné ze slov

Funkce, která slouží k odfiltrování příspěvků obsahující zvolené slovo. Jako operátor zde figuruje znak , příkladem využití může být vyhledávací dotaz olympijské hry -letní.

Hashtagy

Klíčové slovo uvedené znakem #, hashtag figuruje jako označení příspěvku klíčovým slovem. Zjednodušují vyhledávání příspěvků a zároveň pomáhá autorům zvýšit dosah jejich tweetů.

Jazyk

Volba, která pomáhá obzvláště při vyhledávání klíčových slov, které jsou například anglicismy a my vyhledáváme příspěvky pouze v češtině. Na výběr je nespočetné množství jazyků včetně češtiny. Příspěvky pouze v češtině získáme pomocí operátoru lang:cs.

Filtrování přes uživatelské účty

Twitter Advanced Search nabízí tři možnosti filtrování dle uživatelských účtů. První možností je autor příspěvku, jenž v podobě operátoru má syntaxi ve formátu from:account_name. Pokud však chceme účty, které reagují nebo jsou mířeny na námi sledovaný učet, využijeme možnost To these account nebo operátor to:account_name.

Poslední možností je pak zmínění sledovaného účtu za pomoci operátoru @account_name.

Obrázek 8 – Filtrování přes uživatelské účty, zdroj: [4], autor: autor

Trendovost a časová dimenze

Velmi užitečným filtrem je také engagement, ve kterém můžeme výsledky filtrovat na zákadě minimálního počtu komentářů, lajků nebo retweetů. Pokud tak sledujeme různé trendy nebo například zmínění nějakého produktu, tak touto funkcí odfiltrujeme vešekré příspěvky, které nenabraly veřejný ohlas nebo měly pouze minimální dosah či dopad.

Operátor minimálního počtu komentářů

min_replies:

Operátor minimálního počtu lajků

min_faves:

Operátor minimálního počtu retweetů

min_retweets:

Časová dimenze umožňuje filtrování příspěvků dle data, tedy například příspěvky od 1.1.2022 do 10.2.2022 a to pomocí operátorů since: (od) a until: (do).

Obrázek 9- Trendovost a časová dimenze, zdroj: [4], autor: autor

Další filtry

Hledání dále můžeme omezit pouze na původní příspěvky, tedy vymazat odpovědi nebo naopak pouze odpovědi, zároveň můžeme určit, jestli chceme zobrazovat všechny tweety a nebo pouze tweety obsahující odkaz.

Obrázek 10 – Odpovědi a odkazy, zdroj: [4], autor: autor

Tímto jsou obsaženy všechny filtrovací funkce, které obsahuje interface Advanced Search. Při psaní textového dotazu obsahuje search engine ještě další skryté funkce(viz obrázek 11 a 12) a také geolokační funkci near:, za kterou můžeme doplnit název lokace, poštovní směrovací číslo, město, stát nebo GPS souřadnice.

Obrázek 11 – skryté filtry, zdroj: [1], autor: autor

Obrázek 12 – skryté filtry 2, zdroj: [1], autor: autor

Využití TAS v praxi

Twitter je sice označován jako sociální síť, stal se však i prostorem, kde se zabydlely státní instituce, novináři nebo politici. Představuje tak kvalitní zdroj informací různého charakteru. Pomocí představených pokročilých filtrů má uživatel možnost dohledat získat jakékoli informace, které jsou na službě dostupné.

Případů užití je tak nepřeberné množství. Půjdeme-li na situaci například z pohledu novináře, můžeme například sledovat politickou krizi na základě filtrování pomocí klíčových slov, uživatelů a časové dimenze.

Jako další příklad si můžeme představit majitele pražského restauračního podniku. Ne každý návštěvník píše recenze, ať už je to na Yelp či do Google maps. Mohou být ale případy, kdy se zákazník svěří se zkušeností s podnikem na Twitteru, kde na příspěvek může reagovat větší množství uživatelů.

Závěr

K roku 2020 bylo na Twitteru zveřejněno každou vteřinu průměrně 6000 tweetů, to znamená 500 milionů tweetů každý den. Síť tak obsahuje nepřeberné množství obsahu, ve kterém je velice těžké se orientovat. Tyto pokročilé možnosti filtrování tak usnadňují orientaci v příspěvcích jak obyčejným uživatelům, tak uživatelům, které spravují účty velkým společnostem či státním institucím.

Zdroje

  1. Search operators | Docs | Twitter Developer Platform . 302 Found [online]. Copyright © 2022 Twitter, Inc. [cit. 11.02.2022]. Dostupné z: https://developer.twitter.com/en/docs/twitter-api/v1/rules-and-filtering/search-operators
  2. Everything You Need to Know About Twitter Advanced Search. Search Engine Journal – SEO, Search Marketing News and Tutorials [online]. Dostupné z: https://www.searchenginejournal.com/twitter-advanced-search-guide/214202/#close
  3. How Many People Use Twitter in 2022? [New Twitter Stats]. SEO Training and Link Building Strategies – Backlinko [online]. Copyright © 2022 Backlinko is a Trademark of Backlinko LLC [cit. 11.02.2022]. Dostupné z: https://backlinko.com/twitter-users
  4. Twitter. It’s what’s happening.. Twitter. It’s what’s happening. [online]. Copyright © 2022 Twitter [cit. 11.02.2022]. Dostupné z: https://twitter.com

EBSCO eBooks: užitočný zdroj plný elektronických kníh

0
digital library

Úvod

V dnešnej uponáhľanej dobe sú elektronické knihy populárne. Pre ľudí je jednoduchšie si pozrieť a čítať knihy z pohodlia domova bez toho, aby museli niekde chodiť. Myslím tým knižnice a predajne kníh. Samozrejme, že fyzicky držať knihu v ruke má svoje čaro, no množstvu ľudí postačia elektronické knihy. Ak ide hlavne o odborné knihy, ktoré ich vzdelávajú.

EBSCO eBooks je súčasťou EBSCOhost, platformy predstavujúcej prístup k plnotextovým databázam článkov z rôznych oblastí. Najmä z oblasti ekonomiky, manažmentu, obchodu, zdravotníctva, vedy a kultúry. Nejde len o články, ale aj výskumné správy, prípadové štúdie alebo rozhovory s odborníkmi. Samotné EBSCO eBooks sa už zameriava hlavne na elektronické knihy z akademických oblastí. Knihy sú dostupné vďaka zakúpenia trvalej licencie alebo ročného predplatného, ktoré sa stále predlžuje. Knižnica sa týmto spôsobom snaží zachovať prístup používateľom ku knihám od veľkých akademických vydavateľstiev vo všetkých akademických disciplínach.

EBSCO eBooks ponúka výhody, vďaka ktorým používatelia si môžu knihy sťahovať aj do mobilných zariadení, dokážu vyhľadať v knihe konkrétne slová, uložiť si svoje obľubené knihy v svojej záložke, používatelia si dokážu vygenerovať citácie jednotlivých kníh. [1]

Práca so zdrojom

Do EBSCO eBooks sa dostaneme cez platformu EBSCOhost (prístup ponúkajú mnohé univerzitné a regionálne knižnice alebo napríklad Národná technická knižnica). Práca s platformou je veľmi jednoduchá a intuitívna. Na úvodnej stránke dominuje vyhľadávacie pole, ktoré je základom celej platformy. Vyhľadávať knihy je možné na základe základného a rozšíreného vyhľadávania. Základné vyhľadávanie nám ponúka okrem klasického vyhľadávacieho poľa, do ktorého píšeme kľúčové slová alebo výrazy aj obmedzenie výsledkov. Výsledky je možné obmedziť podľa toho, či hľadáme výsledky v plnotextovej podobe alebo je možné samotnú knihu stiahnúť. Ďalej si vieme obmedziť výsledky vďaka vyhľadávaniu na základe ISBN, teda jedinečného identifikačného čísla knihy, mena autora a dátumu publikovania.

ebsco ebooks
Obr. 1 Úvodná stránka EBSCO eBooks [2]

Rozšírené vyhľadávanie je na rozdiel od základného doplnené o vydavateľa, jazyk publikácie a hlavne o Booleovské operátory AND, OR a NOT. Vďaka ním môžeme pri vyhľadávacom dotaze uviesť viac kľúčových slov, ktoré nimi prepojíme. Pomocou operátoru AND sa vyhľadajú výsledky, ktoré obsahujú všetky kľúčové slová dotazu. Pomocou operátoru OR je vyhľadaný výsledok na základe jedného, druhého alebo obidvoch kľúčových slov. Použitím tohto operátora docielime viac nájdených výsledkov. A posledným operátorom je NOT, ktorý znamená negáciu. Teda na základe kľúčového slova, ktoré za operátorom stojí nám výsledok nenájde.

Ďalšou dôležitou súčasťou rozšíreného vyhľadávania sú polia, ktorými si definujeme, čo dané kľúčové slová by mali vo výsledkoch znamenať, resp. kde vo výsledku by sa malo kľúčové slovo nachádzať. Kľúčové slovo pomocou tohto vyhľadávania je možné hľadať vo všetkých textových poliach, v názve knihy, v mene autora knihy, v téme, kategórii, ISBN, roku vydania alebo názve vydavateľa.

Pri vyhľadávacom poli je umiestnený aj odkaz na históriu vyhľadávania, aby sme sa vedeli vrátiť k tomu, čo sme hľadali a akú rešeršnú stratégiu sme použili. Tiež sa tam nachádza odkaz na výber databázy, v ktorej budeme hľadať. Automaticky je zaškrtnutá databáza eBook Collection, pretože sa v nej nachádzame, ale je možné pridať vyhľadávanie v ďalších, ako napríklad Audiobook Collection (databáza zameraná na audioknihy) alebo GreenFILE (databáza obsahujúca informácie o životnom prostredí).

V ľavej časti hlavnej stránky EBSCO eBooks je možné elektronické knihy vyhľadávať jednoducho na základe akademických kategórií. Konkrétne ide o kategórie umenie a architektúra, biografie a pamäte, obchod a ekonomika, informatika, vzdelávanie, inžinierstvo a technológie, zdravie a medicína, história, matematika, filozofia, politické vedy, psychológia, náboženstvo, veda, rodina a vzťahy, spoločenské vedy, šport a hry, študijné a jazykové príručky a cestovanie.

V hlavnej časti úvodnej stránky sa nachádzajú najvýznamnejšie knihy a knihy, ktoré pre jednotlivé kategórie doporučujú. Samotný náhľad knihy obsahuje obrázok obalu knihy, jej názov a meno autora. [2]

Ak si na konkrétny výsledok vyhľadávania klikneme, dostaneme sa na podrobnú stránku venovanú informáciám o samotnej knihe. Dominantný je názov knihy a pod ním sa dozvieme meno autora knihy, publikačné informácie (kto ju vydal, kde a kedy bola vydaná), typ zdroja (v našom prípade pôjde o eBook), stručný popis knihy, aby bolo jasné o čom kniha je. Ďalej témy a kategórie, do ktorých kniha podľa obsahu patrí, ISBN a popis práv na užívanie, teda či si je možné knihu stiahnuť, vytlačiť, poslať e-mailom a podobne. V pravej časti stránky je vždy fotografia obalu knihy a nástroje, pomocou ktorých môžeme eBook citovať, sťahovať, exportovať, poslať e-mailom, pridať si do zložky alebo vytvoriť k nej poznámku. V ľavej časti stránky si môžeme knihu zobraziť celú, stiahnuť ju alebo citovať pomocou softwaru citace PRO. Táto funkcia je veľmi pomocná pri písaní diplomových a iných vysokoškolských prác. V spodnej časti stránky je obsah, ktorý sa skladá z odkazov. Po kliknutí na jednotlivé odkazy alebo názvy kapitol sa nám rovno objaví začiatok kapitoly umiestnený v plnotextovej podobe knihy. [3]

Obr. 2 Náhľad na konkrétny výsledok vyhľadávania [3]

Detailný pohľad na knihu je typický tým, že u neho dominuje samotná kniha. Predovšetkým predný obal knihy. Pod knihou je jednoduchý panel, vďaka ktorému je možné knihu listovať, približovať lupou a zväčšiť ju na celú obrazovku. Nad knihou sa nachádza panel s už spominanými užitočnými nástrojmi. Teda knihu je možné pridať do vlastnej zložky, uložiť si jednotlivé stránky, odoslať ich e-mailom a podobne. V ľavej časti je panel so základnými informáciami o knihe a pod informáciami sa nachádza interaktívny obsah knihy. Je založený na odkazoch, ktoré nás premiestnia do konkrétnych kapitol knihy. Pri názvoch kapitol je symbol stiahnutia, používateľom je umožnené sťahovať si jednotlivé kapitoly do počítača. Ale na druhú stranu tam existuje limit sťahovania strán, je možné stiahnuť len určitý počet. Vždy si to sťahujeme ako PDF alebo EPUB súbor a môžeme si zvoliť aké a koľko stránok si stiahneme. [4]

Obr. 3 Zobrazenie konkrétnej knihy v databáze [4]

Jednoduché vyhľadávanie

Pre ukážku jednoduchého vyhľadávania si nájdeme knihy z ekonomickej oblasti. Do vyhľadávacieho poľa som zadal pojem „economy“. Ako je možné vidieť, tak nám pole okamžite ukazuje nápovedu. V podstate dopĺňa slová za nás alebo pridáva k ním ďalšie relevantné kľúčové slová, ktoré oddeľuje operátormi AND a OR. Ak dáme vyhľadať, tak sa nám objavia všetky výsledky. Celkovo nám našlo 75 elektronických kníh, to môžeme vidieť hore vľavo. Výsledky vyhľadávania sa najčastejšie zobrazujú od najviac relevantných. V ľavej časti stránky sa nám objavil nový panel, ide o filtračný panel, kde je možné výsledky vyhľadávania ešte viac upresniť. Výsledky je možné obmedziť len na tie, ktoré sú plnotextové a sú k dispozícií k stiahnutiu. Taktiež ich je možné filtrovať podľa dátumu publikovania, pomocou časovej osi. Potom podľa typu zdroja, v našom prípade pôjde stále o eKnihy. A klasicky podľa vydavateľa, jazyka knihy, témy a kategórie, do ktorej bola kniha zaradená. Ja som si konkrétne obmedzil výsledky na plnotextové a k dispozícií k stiahnutiu. A potom som chcel nájsť čo najviac aktuálne knihy, tak preto som si ich obmedzil len podľa roku vydania, na roky 2020 a 2021. Našlo mi celkovo už len 12 výsledkov vyhľadávania. Týmto spôsobom je možné skúšať aj iné rešeršné stratégie. [5]

Rozšírené vyhľadávanie

Ak potrebujeme robiť zložitejšie rešeršné stratégie, tak nám jednoduché vyhľadávanie nebude stačiť. Ide hlavne o ten prípad, ak sa v databáze nachádza veľké množstvo záznamov a my potrebujeme nájsť malý počet pre nás relevantných zdrojov. Pomocou rozšíreného vyhľadávania som ostal v ekonomickej oblasti, ale pojem „economy“ som rozširil o podobné pojmy „economic“ a „economics“, pričom som použil operátory OR, ktoré vezmú do úvahy aspoň jeden z daných pojmov. Kľúčové slovo ekonómia som doplnil ešte o ďalšiu oblasť, a to vzdelávanie alebo „education“. Teda hľadám elektronické knihy z oblasti vzdelávania ekonomiky alebo ekonómie. Za týmto kľúčovým slovom som použil operátor AND, aby mi vždy našlo knihy z obidvoch oblastí. Ďalšie nastavenia som nechal tak, ako boli prednastavené automaticky.

Týmto vyhľadavaním som dostal až 775 výsledkov vyhľadávania, čo je celkom veľké číslo na takú malú databázu a hľadať čo najvhodnejšie knihy pre mňa by trvalo dlho. Preto som sa rozhodol vyhľadávanie trochu obmedziť. Kľúčové slová aj operátory som ponechal tak, ako som ich mal pôvodne. Ale vyhľadávanie pri pojme „education“ som obmedzil na kategóriu, pretože chcem, aby mi vyhľadalo knihy, ktoré patria do kategórie vzdelávanie a nie ekonómia alebo ekonomika. A kľúčové slová z oblasti ekonómie som nastavil tak, aby ich hľadalo v názve knihy. Týmto postupom vyhľadávania som získal už len 12 elektronických kníh. Samozrejme existuje množstvo rôznych postupov ako je možné vyhľadávať. Mohol som používať iné alebo viac kľúčových slov, taktiež mohol som používať filtre a tým by som dostal iné výsledky. [5]

Sťahovanie kníh

Ak chceme knihy z databázy EBSCO eBooks sťahovať musíme byť v nej prihlásený pod svojím osobným My EBSCOhost účtom. Pre prípad ak nemáme vytvorený svoj účet, tak sa vieme jednoducho zaregistrovať alebo sa klasicky do účtu prihlásime. Následne si nájdeme v databáze konkrétnu knihu, ktorú si chceme stiahnuť a nastavíme si požadované parametre pre samotným stiahnutím. Ide o dlžku stiahnutia a v akom formáte ju potrebujeme. Pre sťahovanie do osobného počítača sa odporúča formát PDF a pre sťahovnanie do mobilného zariadenia formát EPUB. Knihu potom už jednoducho stiahneme. Ale nie všetky knihy bude možné okamžite získať, pretože niektoré majú nastavené osobitné práva. Niektoré knihy si môže v jeden okamih pozerať len jeden alebo niekoľko užívateľov databázy.

Ako som už spomínal, tak elektronické knihy je možné sťahovať aj do mobilných zariadení. Týmto má databáza konkurenčnú výhodu, pretože ku knihe sa môžu používatelia dostať kdekoľvek a kedykoľvek. Pre využívanie tejto služby je potrebné mať v svojom zariadení stiahnutú aplikáciu Adobe Digital Editions a byť prihlasený pod svojím Adobe ID. Potom je potrebné cez svoj mobilný internetový prehliadač sa pripojiť do databázy EBSCO eBooks a nájsť si knihu, ktorú potrebujeme stiahnuť. Klikneme na tlačidlo stiahnuť, zvolíme si počet dni, na ktoré si chceme knihu požičať a ideálne si ju stiahneme vo formáte EPUB. Je taktiež dôležité sa odkázať na aplikáciu Adobe Digital Editions, v ktorej následne knihy uchovávame. Takto jednoducho môžeme pristupovať k plnotextovým verziám odborných kníh prostredníctvom mobilného zariadenia. [6]

Záver

Práca s databázou EBSCO eBooks je veľmi jednoduchá, intuitívna a „user-friendly“. Je to možno aj z toho dôvodu, pretože samotná databáza nie je príliš veľká, ma len stovky záznamov, ale samotné EBSCOhost sa skladá z viacerých takýchto databáz. Je užitočná hlavne pre študentov, ktorí píšu záverečné práce a potrebujú rýchlo nájsť plnotextové knihy z pohodlia domova z viacerých akademických oblastí. Ale na druhú stranu je vhodná aj pre čitateľov, ktorí radi čítajú odborné knihy najmä v angličtine a radi sa vzdelávajú.

Zdroje

[1] EBSCO eBooks: Home: What are EBSCO eBooks? [online]. [cit. 2022-02-10]. Dostupné z: https://ebsco.libguides.com/ebooks/home

[2] EBSCOhost: eBook Collection [online]. [cit. 2022-02-10]. Dostupné z: https://web-p-ebscohost-com.zdroje.vse.cz/ehost/search/basic?sid=a8c01d25-9bc9-4f4c-95de-a30352fa07a7@redis&vid=0&tid=2003EB&sdb=nlebk

[3] EBSCOhost: eBook Collection [online]. [cit. 2022-02-10]. Dostupné z: https://web-p-ebscohost-com.zdroje.vse.cz/ehost/detail/detail?vid=2&sid=a8c01d25-9bc9-4f4c-95de-a30352fa07a7%40redis&bdata=Jmxhbmc9Y3Mmc2l0ZT1laG9zdC1saXZlJnNjb3BlPXNpdGU%3d#db=nlebk&AN=2501501

[4] EBSCOhost: eBook Collection [online]. [cit. 2022-02-10]. Dostupné z: https://web-p-ebscohost-com.zdroje.vse.cz/ehost/ebookviewer/ebook/bmxlYmtfXzI1MDE1MDFfX0FO0?sid=a8c01d25-9bc9-4f4c-95de-a30352fa07a7@redis&vid=2&format=EK&rid=1

[5] EBSCO TUTORIALS. EBooks and Audiobooks [online]. [cit. 2022-02-10]. Dostupné z: https://www.youtube.com/playlist?list=PLLqgYj2sU6yqWgAdLtHu4ZVkObghzsEdR

[6] EBook Collection from EBSCO: Downloading EBSCO eBooks and Downloading EBSCO eBooks to a Mobile Device [online]. [cit. 2022-02-10]. Dostupné z: https://libguides.unf.edu/ebooks/EBSCOeBooks

[titulný obrázok] Pixabay [online]. [cit. 2022-02-10]. Dostupné z: https://pixabay.com/cs/illustrations/tablet-ruce-dr%C5%BEet-knihy-po%C4%8D%C3%ADta%C4%8D-1632909/

AMiner: Vaše dvere do sveta vedy

0
green and red light wallpaper

ArnetMiner systém druhej generácie (1), AMiner je systém zameraný na zhromažďovanie akademický článkov a ich autorov. Systém sa snaží pomôcť výskumníkom a vedcom zorientovať sa v obrovskej heterogénnej sieti tvorenou autormi, ich publikáciami, vedeckými konferenciami, žurnálmi a akademickými organizáciami (2). Aby ste sa pri svojom pátraní dostali len k relevantným a dôveryhodným zdrojom, AMiner je vybavený „ranking“ systémom, kde sú jednotlivý autori, výskumníci, konferencie a publikácie ohodnotený podľa súvisiacich metrík. Medzi nimi napríklad „Hirschov index“ (h-index), čo je kvantitatívna metrika, ktorá hodnotí autora podľa odhadu dôležitosti, prínosu a vplyvu kumulatívnych príspevkov autora (3).

Ako to funguje?

Celý systém je založený na strojovom učení, ktoré je zodpovedné za celý proces získavania informácií. V skratke sa jedná o 5 krokov, pomocou ktorých sú „vyťažené“ informácie získané, spracované a následne publikované.

  1. Extrakcia informácie: Jedná sa vlastne o automatickú extrakciu profilu autora z Webu. Systém identifikuje a zozbiera relevantné stránky autora a následne z nich vyberie dáta, ktoré sú spracovávané v ďalších krokoch.
  2. Integrácia: V tomto kroku sú zozbierané informácie spojené a integrované z profilom autora a jeho publikáciami. Systém využíva komplexné algoritmy a metódy strojového učenia, aby odstránil prípadné chyby zaradenia v rámci publikácií s podobným obsahom a názvom.
  3. Uloženie a sprístupnenie: Integrované dáta sú následne uložené a hlavne indexované podľa pravidiel a pre čo najefektívnejšie vyhľadávanie v rámci systému.
  4. Modelovanie: Využíva generatívny pravdepodobnostný model, ktorý slúži na roztriedenie jednotlivých zdrojov podľa obsahu do preddefinovaných kategórií.
  5. Služby: Na koniec je zdroj spracovaný pomocou služieb poskytovaných AMinerom. Medzi nimi už napríklad spomínaný systém ohodnotenia autorov/publikácií, vyhľadávanie podľa profilu používateľa (odporúčania podľa histórie a preferencií používateľa), a iné (2).

V tejto kapitole sa zoznámime s funkciami a možnosťami, ktoré systém AMiner poskytuje.

Prerekvizita

Aby sme mohli funkcie AMineru využiť na plno, je doporučené vytvoriť si účet, ktorý je využívaný na profiláciu používateľa. Ak je používateľ sám autorom publikácií, môže sa v rámci svojho profilu systému identifikovať a následne svoje publikácie spravovať. Akademický profil autora je vytváraný automaticky a autor sa môže nájsť pomocou svojho mena, názvu organizácie a kľúčových slov publikácie. Ak svoj profil autor nenájde, je možné kontaktovať podporu, ktorá autorovi akademický profil vytvorí.

Výber kľúčových slov zo zoznamu zaindexovaných výrazov [zdroj: Autor]

Vyhľadávanie a preferencie

Po vytvorení účtu si nastavíme kľúčové slová, ktoré si vyberieme zo zoznamu zaindexovaných výrazov. Podľa vybraných kľúčových slov, ktoré by mali približne definovať naše záujmy. Pozor! Ak chceme systém využívať na plno, je odporučené si na výbere kľúčových slov dať naozaj záležať a to preto, pretože vybrané záujmy budú následne odrazené nie len na odporučených publikáciách na úvodnej stránke, ale aj výsledky samotného vyhľadávania budú do určitej miery ovplyvnené vybranými výrazmi.

Po výbere kľúčových slov sa nám aktualizuje zoznam náhodne vybraných článkov, ktoré systém považuje za relevantné vzhľadom na preferencie používateľa. Odporučené články sa viažu aj na históriu vyhľadávania používateľa a prípadnými článkami, ktoré si používateľ označí za „sledované“.

Samotné vyhľadávanie je už potom len otázka správnej formulácie vyhľadávaného výrazu. AMiner ale predsa poskytuje ešte niekoľko možností, ako vyhľadávanie upresniť.

Príklad rozšíreného vyhľadávania. [zdroj: Autor]

Hľadaný výraz je teda možné rozšíriť o „kanál“, čím sa myslí odvetvie, z akého budú prezentované výsledky. Ďalej je vyhľadávanie možné rozšíriť o autora, publikáciu/konferenciu, kde bolo vedecké dielo prezentované a kľúčové slová. Do upresnenia vyhľadávania je možné napísať viac výrazov a to pomocou znaku „+“ (napr. binarized + convolutional).

Výsledky vyhľadávania sa následne delia na dve záložky:

  • Paper: Tu nájdeme všetky vedecké publikácie, ktoré sa spájajú s našim vyhľadávaným termínom a prípadným upresnením vyhľadávania. Vo výsledkoch vidíme názov vedeckej publikácie, autorov, rok vydania a ako doplnok koľko krát bol článok v rámci systému citovaný a koľko krát bol zobrazený. Následne sú nám poskytnuté funkcie ako stiahnutie publikácie, zobrazenie na stránkach vydavateľa, „Bibtex“ (funkcia ktorá poskytuje, citácie a JSON zo základnými charakteristikami publikácie – autor, názov, …) a veľmi zaujímavá funkcia „Summarize“, alebo zhrnutie danej publikácie, kedy sú nám systémom AMiner a jeho ML funkcionalitou poskytnuté niektoré časti práce (napr. úvod, výsledky, záver).
Príklad výsledku vyhľadávania. [zdroj: Autor]
  • Expert: V tejto záložke nájdeme všetkých autorov, ktorý sú spojený s vyhľadávaným termínom. Ďalej sa dozvieme zamestnanie autora, jeho zameranie a kľúčové oblasti, ktorým sa autor venuje. Je tu taktiež očividný jeden z nedostatkov takto stavaného systému, kedy strojové učenie, na ktorom je AMiner postavený, nesprávne vytvorilo niekoľko akademických profilov pre jedného autora. Dôvodov na to bude niekoľko, ako hlavné však vidím iné písanie mena a inú formu metadát v článkoch autora.
Príklad nedostatku „ťaženia“ dát z Webu. [zdroj: Autor]

Po výbere autora sa dostávame na jeho akademický profil, kde si môžeme prečítať základné informácie o autorovi, jeho skúsenosti, vzdelanie a krátku biografiu autora. Hlavne si však môžeme pozrieť všeobecnú analýzu autorových príspevkov. Ako prvé si všimneme výskumné záujmy autora vo forme grafu. Jedná sa teda o oblasti a témy, ktorým sa autor venuje, rozdelené podľa roku publikácie. Následne sú to samotné vedecké články, v ktorých je osoba autorom alebo spoluautorom. Na pravej strane sa potom zobrazia informácie o výskumníkoch, s ktorými vybraná osoba spolupracovala, relevantné štatistiky autorových článkov (medzi nimi napríklad spomínaný „Hirschov index“) a ako posledné podobný autori, ktorých diela majú podobnú alebo rovnakú tematiku ako zvolená osoba.

Zobrazenie profilu autora. [zdroj: Autor]

Ďalšie funkcionality

V tejto časti si v skrate predstavíme ostatné funkcionality, ktoré AMiner poskytuje.

Channels

Kanály/obory jednotlivých publikácií. Nájdeme tu všetky kategórie vedeckých publikácií, ktoré AMiner identifikuje. Po výbere kategórie sa dostaneme k základným informáciám, ako napríklad horúce témy danej oblasti, top autori v danej oblasti, ale aj frekvencia publikácií a najčastejšie vyhľadávané kľúčové slová danej oblasti.

Príklad dostupných oblastí v rámci AMineru. [zdroj: Autor]
„Dashboard“ oblasti Computer Science. [zdroj: Autor]

Conference

Zoznam vedeckých konferencií, v ktorých nájdeme autorov danej konferencie, publikované články, odkaz na webové stránky konferencie, prípadne videozáznamy z danej konferencie.

Príklad zobrazovaných konferencií v záložke „Conference“. [zdroj: Autor]

Rankings

Hodnotenie všetkých vedeckých publikácií a ich autorov podľa relevantných mierok. Hodnotenie sa delí do šiestich kategórií a to:

  • Najvplyvnejší výskumníci podľa AI
  • Hodnotenie konferencií
  • Hodnotenie vedeckých organizácií
  • Hodnotenie výskumníkov
  • Najlepšie publikácie vs. najviac citované publikácie
  • Ženy v AI
Ukážka systému hodnotenia. [zdroj: Autor]

Must reading

Výber z najlepšie hodnotených tém vedeckých publikácií podľa počtu zobrazení a publikácií v danej téme.

Ukážka tém v záložke „Must reading“. [zdroj: Autor]

Open Data

AMiner poskytuje celú sieť otvorených dát, ktoré svojou činnosťou pozbieral. V rámci obsahu jednotlivých kategórií v data sete je opísaná metóda zbierania dát v danej kategórií, metóda a typ spracovania jednotlivých údajov. Niektoré kategórie sú bohužiaľ spracované len v Čínštine (jazyk autorov systému).

Systém ešte ponúka pomocníka v podobe chatbota, ale ten je kompletne v čínštine, ktorú autor článku neovláda. Ak by ste sa chceli o používaní jednotlivých funkcionalít systému AMiner dozvedieť viac, odporúčam prečítať si manuál od autorov systému, ktorý nájdete tu!

Záver

V tomto článku som sa pokúsil poskytnúť základný popis fungovania a funkcionalít systému AMiner. Systém je zameraný na „ťaženie“ vedeckých publikácií na Webe, a to za využitia možností umelej inteligencie a strojového učenia, ktoré sú vlastne úplne zodpovedné za celý proces získavania dát, ich kategorizáciu a následnú publikáciu v rámci systému.

Použitá literatúra:

  1. BeckerGuides. (2022, Januára 31). Tools for authors: What is the H index? BeckerGuides. [cit. 2022-02-10]. Dostupné z: https://beckerguides.wustl.edu/authors/hindex
  2. Wan, H., Zhang, Y., Zhang, J., & Tang, J. (2019, Marec 1). Aminer: Search and mining of academic social networks. MIT Press. [cit. 2022-02-11]. Dostupné z: https://direct.mit.edu/dint/article/1/1/58/9974/AMiner-Search-and-Mining-of-Academic-Social
  3. Tang, J. (2016, Február 25). Aminer: Toward understanding big scholar data. [cit. 2022-02-11], Dostupné z: https://keg.cs.tsinghua.edu.cn/jietang/publications/WSDM16-Tang-AMiner.pdf

Zoological record: Zvířecí říše pohromadě již od roku 1864

0
standing penguin on sand near snow covered mountain covering the sun from view at daytime

Kde se klasifikují všechny živočisné druhy?

Někteří náboženští fanatici se s vámi budou hádat o původu lidstva. Avšak z faktické stránky věci je jasné, že našim původcem je nějaký druh primáta nebo jiný podobný předchůdce dnešního člověka. Co se týče živočišných druhů, vědecká komunita objevuje stále nové a nové organismy, které je potřeba klasifikovat. Na právě tuto potřebu odpovídá již více než století neoficiální databáze zvaná Zoological record. Pokrývá všechny aspekty zoologie a zvířecích věd, jako například chování, fysiologie, taxonomie, evoluce, zoogeografie…

  • Zastává několik hlavních funkcí:
    • Rozhoduje o zápisu prvního objevu nového druhu
    • Sleduje výzkum ve významných oblastech, jako například biodiversita, ekologie nebo ochrana divoké přírody
    • Zaznamenává změny ve zvířecích klasifikacích a celkově vztazích mezi organismy
    • Zajištuje popis nových druhů
    • Identifikuje potencionální spolupracovníky díky množství citací
    • Sjednocuje celý proces vyhledávání, zápisu i vytváření bibliografie do jednoho celkus

O co vlastně jde?

Jedná se o nejstarší databázi zvířecích druhů. Dříve vydávána v papírové podobě jako vědecká publikace s názvem „Record of Zoological literature“, první výtisk byl vydán v roce 1864 v Londýně. Díky spolupráci s Web of Science se podařilo seskupit více než 150 let výzkumu v dané oblasti a databázi zdigitalizovat do přijatelné formy pro snadné vyhledávání. Od jeho vzniku systém zaznamenal až 1,2 milionu nových druhů. Zajímavostí je, že uchovává i druhy dávno vyhynulé.

  • Všechny záznamy jsou uspořádány kolem 5 hlavních hierarchií
    • Subject
    • Geographical
    • Paleontological
    • Systematic
    • Taxa notes

Jak lze vyhledávat?

Vyhledávací možnosti jsou velmi rozmanité a propracované. Díky zveřejnění na Web of Science vyhledávání nabízí spoustu funkcionalit, jako je Query builder, ukládání předchozích hledání atd. Výhodou publikování na tak rozsáhlý systém je zcela jistě nápověda v podobě chatu nebo interaktivního průvodce vyhledáváním (viz obrázek č. 1).

[1] Úvodní obrazovka pokročilého vyhledávání v Zoological Record databázi (zdroj: vlastní)

V psaní dotazů máme dvě možnosti:

1. Použití Query builderu, kde v prvním rozbalovacím menu najdeme všechny hlavní části vyhledávání kde se má klíčové slovo nacházet. Například pokud chceme najít všechny články o psech se slovem „dog“ v názvu, pak zvolíme v combobox Title a do navazujícího okna hledané slovo (obrázek č. 2). Poslední volbou na řádku jsou booleanské operátory (AND, OR, NOT), které slouží ke specifikaci vazeb mezi jednotlvými vyhledávanými výrazy.

[2] Dropdown menu pro vyhledávání klíčových slov (zdroj: vlastní)

2. Použití Query Preview, který slouží pro ruční psaní dotazů. Vedle okna se nachází nápověda pro použití tzv. field tags (viz obrázek č. 3), které představují zkratky pro abstract, téma, popisek atd. Zárověň se do něj ukládají výsledky z Query builderu, jež zde můžeme dále ručně upravovat. Je zde také možnost přidat rozmezí dat pro hledaný výraz pomocí tlačítka „Add date range“.

[3] Query preview a nápověda Field Tags (zdroj: vlastní)

Orientace ve výsledcích

Pokud se zaregistrujeme do platformy Web of science, pak se zpřístupní možnost dostávat emailem novinky o zveřejněných rešerších na zvolené téma.

Po vymezení samotného dotazu máme možnost ve vyhledávání používat filtry, které jsou podobné struktuře mnohých e-shopů. Jsou velmi uživatelsky přívětivé a myslím si, že nikdo nemá problém při jejich používání. Seznam všech možných filtrů je vidět na obrázku č. 4.

[4] Přehled možných kategorií podle kterých lze filtrovat (zdroj: vlastní)

Kromě klasických filtrů jako rok publikace nebo autor, zde můžeme najít také filtr pro organismy, který vypíše všechny jednotlivé druhy nalezené pod hledaným slovem i s jejich počty výskytu. Takovéto rozdělení dělá databázi právě tak jedinečnou. Pokud zvolíme možnost „Analyze result“, pak se nám vykreslí vizuální mapa nebo sloupcový graf s výskytem četností hledaného výrazu daných druhů. (viz obrázek č. 5).

[5]Mapa analyzovaných výsledků vyhledávání (zdroj: vlastní)

Pokud se dostaneme na úroveň konkrétního příspěvku, pak uvidíme základní popis, indexaci a klasifikaci, poslední citace nebo třeba informace o publikaci (ISSN, aktuální vydavatel…). Všechny výsledky vyhledávání je možné exportovat.

Je databáze veřejná dostupná nebo uzavřená?

Přístup k rozhraní není veřejnosti dostupný, avšak několik univerzit má garantované licence pro své studenty (například Univerzita Karlova nebo Masarykova univerzita v Brně). Pro ostatní studenty českých univerzit je možnost se zaregistrovat do Národní technické knihovny, která přístup do databáze poskytuje, pro své uživatele s platnou registrací, pomocí sekce s elektronickými zdroji.

Na druhou stranu je databáze plně integrovaná s ostatními v rámci platformy Web of Science, čili ke konkrétním publikacím je možné se dostat také pokud se ni odkazují články z jiných databází.

Závěr

Dnes je vědecky uznávaným zdrojem pro výzkum univerzit, muzeí a zoologických zahrad. Také je uznávaná jako neoficiální registr taxonomických jmen a jejich změn. Při stanovení nových záznamů do registru probíhá podobný výzkum jako při zápisu do patentových systémů.

Zdroje

[1] Customer Success Team, Zoological Record – Descriptive Document [online]. [cit. 7.2.2022]. Dostupné z:  https://clarivate.libguides.com/ld.php?content_id=50307321

O krok blíže k otevřené vědě s OpenAIRE

0
picture for OpenAIRE article

Úvod

Data a informace nás dnes obklopují téměř na každém kroku a mezi takovýmto množstvím dat je těžké najít relevantní informace, které potřebujeme. Naštěstí existují informační portály, kde jsou data přehledně uspořádána a kde lze vyhledat pro nás relevantní zdroje. Příkladem může být projekt OpenAIRE, který je takovýmto důvěryhodným informačním zdrojem.

Projekt OpenAire

OpenAIRE je projekt financovaný Evropskou komisí, který podporuje otevřený přístup – Open Access – k výsledkům vědecké činnosti.

Navazuje na projekt DRIVER I a II, jenž byl první z projektů financovaných Evropskou komisí, a který realizoval možnost vytvoření propojené infrastruktury digitálních úložišť s otevřeným přístupem. V roce 2009 vznikl první projekt OpenAIRE také zaměřený na podporu otevřeného přístupu a otevřené vědě. V rámci tohoto projektu vznikl stejnojmenný portál, který sdružuje, poskytuje, spravuje a propojuje výsledky vědecké činnosti. Jsou zde propojeny jednotlivé součásti vědecké činnosti – informace o projektu, datové sady i jednotlivé publikace. Poskytuje také službu výměny metadat mezi jednotlivými uživateli.

Mise OpenAIRE

Posunout odbornou komunikaci směrem k otevřenosti a transparentnosti a usnadnit inovativní způsoby komunikace a monitorování výzkumu. [1]

Vize OpenAIRE

Transformujeme společnost prostřednictvím ověřených vědeckých poznatků. Umožněme občanům, pedagogům, sponzorům, státním úředníkům a průmyslu najít způsoby, jak učinit vědu užitečnou pro ně samotné, jejich pracovní prostředí a společnost. [1]

Z dalších činností můžeme jmenovat:

Slazení zásad
Zapojení všech zúčastněných stran do efektivní implementace otevřené vědy. Podporujeme otevřený vědecký dialog o politikách a jejich provádění v Evropě i mimo ni. Naše síť 34 National Open Access Desk (NOAD) provozuje European Helpdesk podporující koordinovaný přechod na otevřenou vědu. [1]

Podpora změny kultury pro praxi otevřené vědy

Školíme výzkumné pracovníky, poskytovatele obsahu, tvůrce politik, aby získali dovednosti a kompetence pro praxi otevřené vědy. Prostřednictvím našeho programu pro školení školitelů a National Open Access Desk oslovujeme širokou a různorodou uživatelskou základnu. [1]

V současné době portál zahrnuje celkem 153 763 458 záznamů, 2 859 800 projektů, 167 003 zapojených organizací. Všechny služby je možné využít zdarma (pouze některé služby mohou vyžadovat ověření).

number of OpenAIRE publications
Obrázek 1: Počty záznamů na portálu OpenAIRE (zdroj: Autor, převzato z www.openaire.eu)

Co nabízí OpenAIRE?

provides of OpenAIRE
Obrázek 2: Co nabízí OpenAIRE (zdroj: Autor, převzato z www.openaire.eu)

Pro výzkumné pracovníky:

  • najít všechny publikace a data vašeho projektu
  • šířit vlastní výzkumné výstupy
  • dodržovat zásady otevřeného přístupu ES a národních poskytovatelů finančních prostředků pro publikace a data [2]

Pro vedoucí projektů:

  • shromažďovat všechny výstupy všech vašich projektů na jednom místě
  • dodržovat zásady otevřeného přístupu ES a národních poskytovatelů finančních prostředků pro publikace a data [2]

Pro správce úložišť:

  • zefektivnit interoperabilitu mezi vaším úložištěm a nástrojem EK pro podávání zpráv o publikacích
  • zvýšit svou viditelnost [2]

Pro finanční sponzory projektů:

  • sledovat všechny výsledky výzkumu financované z vašeho finančního toku
  • sledovat dostupnost výsledků výzkumu Open Access pocházejících z vašeho finančního toku
  • získat lepší přehled o dopadu financování prostřednictvím statistik šitých na míru [2]

Vyhledávání na portálu OpenAIRE

Explore OpenAIRE


Obrázek 3: Základní vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

První možností, jak vyhledávat na portálu je přímý dotaz. Překliknutím do záložky EXPLORE se objeví vyhledávací pole, do kterého můžeme dotaz zadat. Je možné vyhledávat ve všech záznamech – All Content nebo vyhledávat pouze v jednotlivých kategoriích – Research outcomes, Projects, Content providers, Organizations. Výsledky vyhledávání lze seřadit podle relevance nebo data. Seznam výsledků je k dispozici ke stažení. Na Obrázku 4 můžeme vidět, že je možné pro vyhledávání nastavit po levé straně filtry.


Obrázek 4: Výsledky vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

Pro Projects:

  • Active within
  • Funder
  • Start year
  • End year
  • Special clause

Pro Research outcomes:

  • Acces mode
  • Result type 
  • Year range
  • Funder
  • Type
  • Language
  • Community
  • Content Provider
  • Country

Pro Content Providers:

  • Type
  • Language
  • Content
  • Compatibility Level 
  • Country
  • Collected from

Pro Organization:

  • Country

Na Obrázku 5 vidíme další možnost vyhledávání, kterou je Advanced search. Po kliknutí na Advanced search pod tlačítkem Search se objeví rozšířenější vyhledávací okno. Můžeme vybrat, zda chceme zadaný výraz hledat ve všech polích, která vyhledávání nabízí nebo se omezit jen na jedno konkrétní pole. Možnosti jsou například Author, Title, Community, Organization, Language.
Do kolonky TERM napíšeme hledaný výraz – klíčové slovo. Poté je možné přidat tlačítkem + další pravidlo pro vyhledávání a také nastavit, zda mají pravidla být spojena výrazem AND, OR nebo NOT.

Advanced search in OpenAIRE
Obrázek 5: Pokročilé vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

Na Obrázku 6 vidíme detail nalezeného výsledku. Jsou k dispozici konkrétní údaje o autorovi, datu vydání a vydavateli. Dále je k dispozici informace, o jaký typ zdroje se jedná a jak je přístupný. V pravé části je možnost propojení publikace k dalšímu projektu, výsledku či komunitě. Přímo zde je také možné vygenerovat si citaci podle citační normy, kterou si zvolíme. Pro přihlášené uživatele jsou zde navíc dvě možnosti. První je přidat nebo odebrat záznam – ADD to ORCID. Druhou možností je přidání anotace. U některých výsledků je k zobrazení přehled o počtech shlédnutí a stažení – zde 5.


Obrázek 6: Detail výsledku (1) (zdroj: Autor, převzato z www.openaire.eu)

Na Obrázku 7 je Summary dané publikace. Jedná se o Abstract, Pesrsistent identifiers, Subject a Releated Organizations. Jsou zde uvedeny odkazy, kde lze publikaci stáhnout. Pod Persistent Identifiers je uvedeno DOI s odkazem na dokument. Další záložkou po Summary může být References, kde jsou uvedeny zdroje, ze kterých autor čerpal. Pokud je na danou publikaci navázaný nějaký výzkum, tak je zaznamenán v záložce Related research.

Obrázek 7: Detail výsledku (2) (zdroj: Autor, převzato z www.openaire.eu)

Pokud nevyhledáme článek nebo publikaci, ale poskytovatele obsahu – Providers – což může být například časopis, zobrazí se záložka také Summary, stejně jako u publikací, jak vidíme na Obrázku 8.

Obrázek 8: Detail vyhledávání Providers (1) (zdroj: Autor, převzato z www.openaire.eu)

Na rozdíl od publikací zde přibydou záložky Related content providers, Publications a Statistic. Na Obrázku 9 můžeme vidět, kolik výsledků publikoval daný časopis za rok a také o jaké typy výstupů se jednalo.

Obrázek 9: Detail vyhledávání Providers (2) (zdroj: Autor, převzato z www.openaire.eu)

Jedním speciálním případem vyhledávání, respektive výsledkem, jsou datasety nebo software. Pokud chceme vyhledat dataset, ve filtru v sekci Type zaškrtneme Dataset a pokud chceme vyhledat sofware, ve filtru v sekci Type zaškrtneme Software. Po rozkliknutí detailu je možné získat informace stejné jako u všech dalších publikací – jako jméno autora, údaje o přístupu, datumu vydaní a dalšího. Je zde také informace o počtu stažení a počtu shlédnutí.

Obrázek 10: Detail vyhledání datasetu (1) (zdroj: Autor, převzato z www.openaire.eu)

Opět je k dispozici Summary s detailními informacemi a je zde také možnost stažení. Většina datasetů/sofwaru je uložena na platformě zenodo.org, která je součástí projektu OpenAIRE a umožňuje uživatelům vytvořit repozitáře pro trvalé uložení dat.

Obrázek 11: Detail vyhledávání datasetu (2) (zdroj: Autor, převzato z www.openaire.eu)

Zenodo je všestranné otevřené výzkumné úložiště. Bylo vytvořeno OpenAIRE a CERN, aby poskytlo výzkumníkům místo pro ukládání publikací, datových sad a dalších výzkumných artefaktů, jako je kód, plakáty či prezentace. Zenodo neklade žádné požadavky na formát, velikost, omezení přístupu nebo licence… Bylo spuštěno v roce 2013 a umožňuje výzkumníkům v jakékoli oblasti nahrávat soubory až do velikosti 50 GB. Zenodo má integraci s GitHub, aby byl kód hostovaný na GitHubu citovatelný. [2]

Obrázek 12: Zenodo (zdroj: Autor, převzato z www.zenodo.org)

Na této platformě jsou k dispozici opět detaily o daném datasetu/softwaru včetně licence, pod kterou spadají soubory. Pro nahlédnutí do dat je zde část Preview, která již ukazuje konkrétní data z datasetu/konkrétní soubory softwaru. Také jsou zde k dispozici soubory ke stažení. Je zde i informace o verzích daného datasetu/softwaru. Opět je možné dataset/software sdílet mnoha způsoby a exportovat v několika typech souborů.

Obrázek 13: Zenodo detail (1) (zdroj: Autor, převzato z www.zenodo.org)
Obrázek 14: Zenodo detail (2) (zdroj: Autor, převzato z www.zenodo.org)

Závěr

OpenAire je portál, který sdružuje nejen mnoho vědeckých publikací, ale i mnoho výzkumných pracovníků, organizací a poskytovatelů obsahu. Také umožnuje ukládat datasety, kód softwaru nebo prezentace do otevřeného úložiště Zenoda. Stále se rozvíjí. Nejnovějším projektem je OpenAIRE Advance, který pokračuje v uskutečňování myšlenky otevřeného přístupu a otevřených dat.

Zdroje

[1]OPENAIRE, . www.openaire.eu. OpenAIRE [online]. b.r. [cit. 2022]. Dostupné z: https://www.openaire.eu/mission-and-vision
[2]OPENAIRE, . www.openaire.eu. OpenAIRE[online]. b.r. [cit. 2022]. Dostupné z: https://www.openaire.eu/faq

Obrázek 1: Počty záznamů na portálu OpenAiRE (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 2: Co nabízí OpenAIRE (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 3: Základní vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 4: Výsledky vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 5: Pokročilé vyhledávání (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 6: Detail výsledku (1) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 7: Detail výsledku (2) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 8: Detail vyhledávání Providers (1) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 9: Detail vyhledávání Providers (2) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 10: Detail vyhledání datasetu (1) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 11: Detail vyhledávání datasetu (2) (zdroj: Autor, převzato z www.openaire.eu)

Obrázek 12: Zenodo (zdroj: Autor, převzato z www.zenodo.org)

Obrázek 13: Zenodo detail (1) (zdroj: Autor, převzato z www.zenodo.org)

Obrázek 14: Zenodo detail (2) (zdroj: Autor, převzato z www.zenodo.org)

ASPI: I vy se můžete orientovat ve vládních opatřeních a dalších právních předpisech

0
brown wooden tool on white surface

Úvod

Současná pandemická situace se ve velkém promítla i do právních předpisů jednotlivých států. Při neustálých změnách a zásazích Nejvyššího správního soudu není vůbec snadné sledovat, která opatření jsou platná a která už soud nebo vláda zrušila. Pro takové případy jsou velmi vítanými pomocníky systémy, ve kterých uživatel snadno nalezne aktuální a platná opatření. A pokud takový systém navíc dokáže uživatele upozornit v momentě, kdy dojde ke změně, je to k nezaplacení.

Jedním z nástrojů, který přesně tyto funkcionality – a samozřejmě i mnoho dalších – má, je systém ASPI od společnosti Wolters Kluwer, na který se blíže podíváme v tomto článku.

Co systém ASPI obsahuje?

Už dlouhou řasu let je ASPI největší a nejpoužívanější právní informační systém na našem území. Uživatelé zde naleznou informace a postupy ze všech oborů práva, daní a účetnictví. A to vše je jednoduše přístupné online na stránce www.aspi.cz.

K dispozici je uživatelům obrovské množství materiálů, které se dá rozdělit do třech kategorii. První z nich jsou předpisy. V ASPI je pro uživatele dostupná Sbírka zákonů a Sbírka mezinárodních smluv v kompletním znění od roku 1918. U předpisů je tak velice jednoduché porovnat, jak se jejich znění měnilo v čase. Kromě sbírek jsou v systému obsaženy předpisy profesních komor, resortní předpisy a věštníky nebo třeba usnesení vlády.

Druhou kategorii tvoří judikatura nejen České republiky, ale i Evropského soudu pro lidská práva a Soudního dvora Evropské unie. S více než 418 tisíci judikáty je ASPI největší sbírkou soudních rozhodnutí v ČR. Díky unikátní technologii LexRank zobrazuje vyhledané judikáty podle jejich významnosti a relevance. Z českého prostředí je zde kompletní přehled rozhodnutí Ústavního soudu, Nejvyššího soudu a Nejvyššího správního soudu. U soudů nižší instance jsou do ASPI vybrána pouze významná a relevantní rozhodnutí. Mimo to je zde k dispozici rozsáhlá historická judikatura ze sbírek Josefa V. Bohumila a Františka Vážného a Úřadu pro ochranu hospodářské soutěže, Finančního arbitra a dalších ústředních orgánů.

Poslední kategorie je tvořena literaturou. Z této oblasti je v ASPI obsaženo velké množství periodik a vybraných článků z odborných časopisů. Pro jistotu správného postupu je aktuálně k dispozici 357 rozsáhlých a detailně zpracovaných komentářů, které se vztahují k nejdůležitějším právním předpisům. Kromě komentářů je uživatelům k dispozici i více než 1 300 autorských monografií.

Kromě velkého množství materiálů je uživatelům k dispozici i několik nástrojů pro usnadnění práce. Prvním z nich je ASPI průvodce, který uživateli nabídne všechny relevantní informace některé z předpřipravených oblastí.

Obrázek 1: Předpřipravené oblasti pro potřeby ASPI Průvodce. [Autor]

Druhým velmi populárním nástrojem je ASPI Navigátor. V jednotlivých navigátorech uživatel nalezne grafické znázornění postupů podle právních předpisů v jedné z 23 připravených oblastí. Jsou zde jasně ukázány veškeré nezbytné kroky a úkony včetně jejich posloupností a termínů. Ve všech navigátorech jsou navíc interaktivně připojeny předpisy a související dokumenty pro jednoduché zpracování.

Obrázek 2: Ukázka části ASPI Navigátoru. [Autor]

Za zmínku stojí také řada kalkulaček, které jsou v ASPI k dispozici. Pomocí nich může uživatel vypočíst cestovní náklady, odměnu advokáta, soudní poplatky nebo například počet dnů dovolené.

Obrázek 3: Příklad kalkulačky pro výpočet dovolené. [Autor]

Přístup k obsahu

Pro uživatele se nabízejí tři možnosti, jak se systémem pracovat. Nebude-li uživatel nijak náročný, je zde pro něj možnost pracovat s ASPI jednoduše bez registrace. V takovém případě pro něj budou přístupné všechny konsolidované platné a účinné předpisy od roku 1918, avšak bez možnosti personalizovaných nastavení.

Rozhodne-li se uživatel registrovat, otevře si tím přístup ke všem předpisům se všemi jejich změnami v čase, pro případné srovnání, publikované judikatuře včetně právních vět ze sbírek Ústavního soudu, Nejvyššího soudu a Nejvyššího správního soudu. Registrovaní uživatelé také mají možnost nastavit si upozornění na změny předpisů, mohou si vkládat vlastní poznámky, exportovat vybrané dokumenty a zpřístupní se jim také funkce pro jednoduché citování z dokumentů.

Poslední možností, kterou ASPI nabízí, je výběr některého z předplatných. Za roční poplatek 9 990 Kč se uživateli navíc otevře přehled veškerých usnesení vlády ČR od roku 1991, veřejnoprávní smlouvy obcí ČR, základní právní literatura zahrnující 16 časopisů, 12 právních newsletterů a více než 500 právních publikací. Mimo to jsou uživateli k dispozici ještě základní informace o firmách, právní zpravodajství České tiskové kanceláře a jednotlivé předpisy měst a obcí ČR. Pro uživatele, kteří pro práci potřebují znát kompletní vysvětlení, jsou zde další předplatná, která začínají na částce 31 900 Kč za rok. Po zaplacení tohoto předplatného budou uživatelům k dispozici komentáře odborníků, praktické příručky, komentované vzory, ASPI průvodce, navigátory a další nástroje.

Vyhledávání v systému ASPI

Obrázek 4: Úvodní stránka s možností hledání a výběru předpřipravených dokumentů. [Autor]

Pro samotné hledání v systému existuje několik možností. První z nich je jednoduché zadání jednoho slova. Protože hledací algoritmus je nastaven na Český a Slovenský jazyk, hledaný výraz je hledán ve všech jeho gramaticky správných tvarech.

Druhou možností je hledání pomocí víceslovného výrazu.

Obrázek 5: Příklad vyhledání spojení „soud schválil“. [Autor]

V levé části si uživatel může vybrat nejen jaký typ dokumentu chce zobrazit, ale také zdroj dokumentu, druh, účinnost nebo jeho působnost. V pravé části jsou pak zobrazeny výsledky hledání.

Po rozkliknutí vyhledaného dokumentu se v něm zvýrazní hledaný výraz. Z výsledku je patrné, že hledání probíhá nejen v pořadí, ve kterém jsou slova ve výrazu napsána, ale i v opačném, zároveň jsou hledány výsledky, ve kterých jsou od sebe zadaná slova ve vzdálenosti až tří slov. Ve výsledku se nabízí také negace hledaného výrazu.

Obrázek 6: Příklad rozkliknutí 89/12 Sb.. [Autor]

Pro vyhledávání je možné používat i speciální znaky a logické spojky, pomocí kterých můžeme výraz více specifikovat. Jejich přehled je v obrázku 7.

Obrázek 7: Přehled logických spojek a speciálních znaků. [https://static.wolterskluwer.cz/content/mediagallery/wkshop_system/file/product/file/16486.pdf]

Mezi další možnosti hledání patří hledání konkrétních paragrafů nebo zadání čísla slovně. V takovém případě systém automaticky bude hledat i numerické vyjádření jak arabskými číslicemi, tak i římskými. Mimo to může uživatel využít i rozšířeného hledání, ve kterém si může více specificky nastavit požadovaný výsledek, ať už se třeba v případě Judikatury jedná o datum rozhodnutí, pramen nebo například spisovou značku.

Obrázek 8: Rozšířené hledání. [Autor]

Závěr

Právní prostředí je pro naprostou většinu lidí španělskou vesnicí. Pro ty, kteří se v něm potřebují zorientovat, ale nemají čas vystudovat právnickou fakultu, je zde systém ASPI a velká spousta odborníků, kteří svými komentáři a monografiemi přibližují právní problematiku laikům.

Systém je ale vhodný i pro lidi, kteří sice jsou alespoň částečně právního prostředí znalí, ale obrovské množství dokumentů dostupných na pár kliknutí je i pro jejich práci velkým benefitem a v dnešní době možná už nezbytností.

Zdroje

ASPI [online].  [cit. 10.02.2022]. Dostupné z: https://www.aspi.cz/

Masarykova univerzita, 2018. Přehled ASPI. Muni.cz [online]. [cit. 10.02.2022]. Dostupné z: https://is.muni.cz/el/law/jaro2018/NV205K/um/Prehled_ASPI.pdf

Wolters Kluwer, 2016. Tipy pro práci s ASPI. Wolterskluwer.cz [online]. [cit. 10.02.2022]. Dostupné z: https://static.wolterskluwer.cz/content/mediagallery/wkshop_system/file/product/file/16486.pdf

Google Programmable Search Engine: vytvorte si vyhľadávač s vlastnými pravidlami

0

Úvod

Google Programmable Search Engine (a.k.a. Google custom search) je platforma vytvorená spoločnosťou Google a je dostupná od 23. Októbra 2006. [1] Google Custom Search Engine umožňuje vytvoriť vyhľadávací nástroj, fungujúci na princípe Google Search, pre webové stránky alebo blogy a je napísaný v jazyku C++. [2]

Nástroj sa dá nakonfigurovať na vyhľadávanie webových stránok a aj obrázkov. Taktiež sa dá doladiť poradie, prispôsobiť vzhľad a dojem z výsledkov. Tento nástroj je možné aj monetizovat pomocou služby Google AdSense. Tento nástroj sa dá využiť dvoma spôsobmi. Prvý spôsob je nástroj ktorý prehľadáva obsah na jednej webovej stránke a druhý spôsob je prehľadávanie zamerané na určitú tému z viacerých webových stránok. Tieto webové stránky si administrátor môže nastaviť, čiže vyhľadávač bude vedieť ktoré stránky má uprednostniť a ktoré ignorovať.

Vytvorenie search enginu

Najjednoduchšia možnosť tvorby Google Custom Search Enginu je pomocou Control Panelu kde užívateľ môže spravovať nastavenia alebo si môže stiahnuť XML súbor s konfiguráciou vytvoreného enginu a následne tento súbor môže viac kustomizovať podľa vlastných potrieb. Kroky pre vytvorenie základného enginu pomocou control panelu sú:

  1. Prihlásenie sa do Control panelu pomocou google účtu
  2. Následne do políčka “Sites to search“ je za potreby vyplniť všetky stránky, ktoré treba zahrnúť v Google Custom Search Engine. Je možné vyplniť hlavné stránky, podstránky alebo sa dá využiť aj URL patterns [3]
  3. Vybranie jazyku a názovu enginu
  4. Create
Vytvorenie Google custom search enginu
Obrázok 1: Vytvorenie Google custom search enginu [zdroj obrázku: 4]

Po vytvorení je možné Google Custom Search Engine použiť troma spôsobmi. Prvý je využitie pomocou verejnej URL adresy ktoré je možné získať z Control panelu. Druhý spôsob využitia je priama integrácia na webové stránky pomocou JavaScript kódu, ktorý sa automaticky vygeneruje. Tretí spôsob je integrácia pomocou REST API.

Príklad verejnej URL a po vyhľadaní slova “FIS” na stránke www.vse.cz dostaneme následovné výsledky:

Obrázok 2: Výsledky vyhľadávania slová „FIS“ pomocou vytvoreného search enginu [zdroj obrázku: 4]

Príklad JavaScriptu je:

<script async src="https://cse.google.com/cse.js?cx=2bc1bef2d87c95489"></script>
<div class="gcse-search"></div> 

ktorý treba vložiť do html tagu <body> svojej stránky.

Kustomizácia search boxu na webovej stránke

Dve základné možnosti kustomizácie sú dvoj stĺpcoví layout a dvoj stránkový layout. Dvoj stĺpcový layout zobrazí search bar a aj výsledky na rovnakej stránke. Tento layout dosiahneme nasledovným html kódom:

<div style="border: 1px solid blue;">
    Area 1 (for example a sidebar)
    <div class="gcse-searchbox"></div>
</div>

<div style="border: 1px solid red;">
    Area 2 (for example main area of the page)
    <div class="gcse-searchresults"></div>
</div>

Dvoj stránkový layout zobrází výsledky na novej stránke. Tento layout dosiahneme nasledujúcim kódom:

<script async src="https://cse.google.com/cse.js?cx=YOUR_ENGINE_ID"></script>
<div class="gcse-searchbox-only" data-resultsUrl="YOUR_RESULTS_PAGE_URL"></div>

Ďalšia možnosť je získlať výsledky priamo bez search baru a to za pomoci url arugmentov, kde do q argumentu vložíme vyhľadávanú frázu (query) a znova do html pridáme nasledujúci html tagy:

<script async src="https://cse.google.com/cse.js?cx=YOUR_ENGINE_ID"></script>
<div class="gcse-searchresults-only"></div> 

Ďalšie možnosti kustomizácie je napríklad zmena farby pozadia, farby písma, fond písma, pridanie loga, zmena farby vyhladadávača, zmena farby tlačítka potvrdenia vyhľadávania a takisto sa dá zmeniť farba písma, pozadia, url a náhľadú pre výsledky a pre reklamy. Všetky tieto zmeny sa dajú urobiť v Control Panely pod záložkou “Look and feel”. Následne stačí kliknúť na “Save & Get Code” a znova sa automaticky vygeneruje html tag s príslušnými zmenami.

Obrázok 3: Kustomizácia farieb [zdroj obrázku: 4]

Kustomizácia search enginu

Kustomizovať Google Custom Search Engine sa taktiež dá priamo v Control panely pod záložkou “Search features”. Prvá možná kustomizácie je pridanie reklám, kde si administrator môže nastaviť pri akom query by mala reklama vyskočiť (dajú sa použiť aj regulárne výrazy), aký je nadpis, url, obrázok a popis reklamy. Následne sa dá nastaviť aj začiatok a koniec reklamy.

Obrázok 4: Vytvorenie promotion [zdroj obrázku: 4]

Po nastavení reklami a vyhľadaní nastaveného query sa reklama zobrazí pod reklamou priamo od Googlu.

Obrázok 5: Vytvorené promotion vo výsledkoch vyhľadávania [zdroj obrázku: 4]

Ďalšia kustomizácia je spresnenie vyhľadávania. Pomocou tejto funkcie sa dá nastaviť sub-vyhľadávanie, ktoré obsahuje nastavné slovo alebo dá prioritu výsledkom ktoré toto slovo obsahujú.

Obrázok 6: Nastavenie sub-vyhľadávania [zdroj obrázku: 4]

Následne po ľubovoľnom vyhľadaní sa zobrazí tab s nastaveným názvom (U tohoto príkladu tab s názvom FIS), ktoré zobrazí iba vyfiltrované výsledky. Napríklad keď sa zadá do vyhľadávača query “Den otevřených dveří”, tak nevyflitrované výsledky najprv zobrazia informácie o dni otvorených dverí všetkých fakúlt, ale po vybraní tabu FIS sú zobrazné dni otvorených dverí na fakulte FIS.

Obrázok 7: Výsledky vyhľadávania a sub-vyhľadávania [zdroj obrázku: 4]

Tretia možnosť kustomizácie je autocomplete kde je možné vypnúť/zapnúť autocomplete, vypnúť/zapnúť autocomplete z celého webu alebo pridať/odobrať autocomplete frázy.

Obrázok 8: Nastavenie autocomplete [zdroj obrázku: 4]

Ďalšia možnost kustomizácie sú synonyma, kde je možné nastaviť páry synoným na základe ktorých potom bude Google Custom Search engine vyhľadávať. Po následnom vyhľadaní nám zobrazí výsledky oboch synoným. Napríklad pri nastavení slova “dvere” ku slovu “den otvorenych dveri” nám následne pri vyhľadaní slova dvere nájde výsledok ku frázy “den otvorenych dveri”.

Obrázok 9: Nastavenie synoným [zdroj obrázku: 4]
Obrázok 10: Výsledky vyhľadávania synoným [zdroj obrázku: 4]

Nasledujúca možnosť kustomizácie je radenie výsledkov. Defaultne sú výsledky zoradené podľa relevancie. Tak isto sa dá nastaviť radenie podľa dátumu, PageMaps, rich snippet markup alebo meta tagov.

Taktiež sa dá nastaviť história vyhľadávania (čo dovolí užívateľovi prejsť na stránku s predchádzajúcim vyhľadávaním), zobrazenie štruktúrovaných dát vo výsledkoch a nastavenie default výsledku (výsledok, ktorý sa zobrazí užívateľovi, keď jeho vyhľadávaná fráza nemá žiadne výsledky).

Posledne sa dá nastaviť reštrikcie vyhľadávania, tak ako pre textové vyhľadávanie, tak aj pre vyhľadávanie obrázkov. Možne reštrikcie sú jazyk vyhľadávania, počet výsledkov, nastavenie extra query fráz a filtrovanie podobne vyzerajúcich výsledkov.

Obrázok 11: Nastavenia reštrikcii a radenia [zdroj obrázku: 4]

Všetky tieto nastavenia a reštrikcie sa buď dajú nastaviť priamo v Control panely alebo ručne pomocou mapovacích XML súborov, takzvaných Context súborov. Dokumentácia týchto súborou je tu.

REST API

Google Custom Search API rozhranie umožnuje vývojárom ziskávať výsledky vyhľadávania pomocou REST requestu. Existuje iba jeden end point (metóda GET) a tento end point má URL https://www.googleapis.com/customsearch/v1?parameters. V parametroch je API key (Generovaný na google účet), Google Custom Search engine ID (ID vytvoreného enginu) a search query (vyhľadávaný výraz). Príklad celého requestu:

GET https://www.googleapis.com/customsearch/v1?key=INSERT_YOUR_API_KEY&cx=017576662512468239146:omuauf_lfve&q=lectures

Ak je request správny, tak odpovedou sú response data, s HTTP statusom 200 OK, a dáta sú vo formáte JSON. Tento JSON file obsahuje metadata opisujúce vyhľadavaný výraz, metadata opisujúce použitý Google Custom Search engine a výsledky vyhľadávania. Takisto pre rôzne programovacie jazyky existujú aj knižnice, ktoré ulahčujú používanie tejto API. Tento typ knižníc sa volajá SDK (software development kit).

OfferingStandard Search ElementNon-profit Search ElementCustom Search JSON APICustom Search Site Restricted JSON API
CostFreeFree$5 per thousand queries $5 per thousand queries
AdsYesNoNoNo
Google BrandingOptionalYesNoNo
Daily Query LimitNo Daily LimitNo Daily Limit10,000 queries per dayNo Daily Limit
ImplemetantionClient side JavaScript Client side JavaScript Client side or server side JSON APIClient side or server side JSON API
AvailabilityEveryoneNon-profits onlyEveryoneSite restricted search engines only
Tabuľka 1: Cenník [5]

Z cenníku vidíme, že využitie Google Custom Search API je platená možnosť. Buď je obmedzená na 10,000 queries denne, ale na všetkých stránkach webu, alebo nemá denný limit, ale je obmedzený počet stránok vyhľadávania.

Záver

V tomto reporte bol opísaný Google Custom Search engine, jeho nastavenia a využitie. Tento engine je možné použiť ako standalone search engine, alebo sa dá integrovať na webové stránky, alebo sa dá využiť API rozhranie pre priamy programový prístup pri vývoji aplikácií. Síce je tento engine prístupný už 16 rokov, stále je veľmi využívaný a často sú pridávané nové features.

Zdroje

  1. [online]. [cit. 11.02.2022]. Dostupné z: http://googlepress.blogspot.com/2006/10/power-of-google-search-is-now_23.html
  2. The Stanford University InfoLab [online]. [cit. 11.02.2022]. Dostupné z: http://infolab.stanford.edu/~backrub/google.html
  3. Choose sites to include in your search engine – Programmable Search Engine Help. Google Help [online]. Copyright ©2022 Google [cit. 11.02.2022]. Dostupné z: https://support.google.com/programmable-search/answer/4513886?visit_id=637801793221195005-2668318665&rd=1
  4. [online]. [cit. 11.02.2022]. Dostupné z: https://programmablesearchengine.google.com/cse/all
  5. Overview | Programmable Search Engine | Google Developers. Google Developers [online]. [cit. 11.02.2022]. Dostupné z: https://developers.google.com/custom-search/docs/overview