Čtvrtek, 5 prosince, 2024

Národní uložiště šedé literatury (NUŠL)

Sdílet

1. Úvodní představení

Národní uložiště šedé literatury (NUŠL) je digitální repozitář cílem kterého je shromažďovat, uchovávat a zveřejňovat informace, které se řadí pod pojem šedé literatury. (1)

Co je šedá literatura? Šedou literaturou (někdy také nepublikovaná nebo polopublikovaná literatura) jsou označované informace, které neprošly klasickým vydavatelským procesem nebo jsou sdílené institucemi primární činnosti kterých není vydavatelství. Tyto informace jsou produkované vládními, akademickými, průmyslovými institucemi atd. (2)

NUŠL je služba Národní technické knihovny, která nabízí svým uživatelům bezplatný přistup k šedé literatuře. Informace jsou získané díky spolupráce z různými producenty šedé literatury. Momentálně vyhledávací rozhráni NUŠL nabízí přibližně 620 000 dokumentu, jejichž původci jsou různé výzkumné instituce, statní a soukromé vysoké školy, muzea, galerie, neziskové organizace atd.  Přínosem této spolupráce pro producenty je dlouhodobá archivace dokumentů, zviditelnění těchto institucí a jejích výstupů v rámci České republiky i zahraničí a také usnadnění povinného zveřejnění informaci pro tyto instituce. (1, 2)

Obr.1 Logo NUŠL. Zdroj: (9)

2. Rešeršní možnosti / Struktura zdroje / Typologie dokumentů

NUŠL se skládá z dvou částí: centrální vyhledávací rozhraní (http://www.nusl.cz/) a digitální repozitář (https://invenio.nusl.cz/). Cely NUŠL systém a jeho komponenty jsou přehledně zobrazené na Obr. 2. (4)

Obr. 2 NUŠL a jeho komponenty. Zdroj: vlastní zpracování,  (4)

2.1. Digitální repozitář

Digitální repozitář je volně přístupný, přičemž je provozován pomoci softwaru Invenio. Tento software je možné volně instalovat, používat, upravovat a uložené informace následně šířit mezi spolupracujícími organizacemi. V rámci nastaveni Invenio pro potřeby repozitáře NUŠL proběhly různé úpravy včetně nastaveni sbírek a šablon. Kromě toho byla provedena grafická úprava rozhraní, které je dostupné v českém a anglickém jazyce. (4)

Na hlavní stránce (viz Obr. 3) je vidět, že dokumenty jsou dělené podle sbírek a zaměření. Sbírky jsou rozdělené do následujících kategorií: Vysokoškolské kvalifikační práce, Zprávy, Autorské práce, Firemní literatura, Konferenční materiály, Analytické a metodické materiály, Propagační a vzdělávací materiály. Sbírky jsou následně rozdělené do subkategorií. Například sbírka Vysokoškolské kvalifikační práce je rozdělená do následujících kategorii: Bakalářské práce, Diplomové práce, Disertační práce, Habilitační práce, Rigorózní práce.

Obr. 3 Hlavní stránka digitálního repozitáře. Zdroj: (8)

Zaměření v digitálním repozitáři jsou vymezené do následujících kategorií: školství, kultura, věda a výzkum, statni zprava a ostatní. Každé z těchto zaměření, podobně jako i u sbírek, je rozděleno do subkategorií, například zaměření Kultura obsahuje následující subkategorií: Galerie, Institut umění – Divadelní ústav, Knihovny, Muzea, Národní filmový archiv, Národní památkový ústav, Národní ústav lidové kultury.

2.1.1. Jednoduché vyhledávání

Na hlavni stránce digitálního depozitáře je přednastavené jednoduché vyhledávání. Zaškrtávací pole v sekci „Hledat jen ve sbírce:“ (viz Obr. 3) umožňují omezit vyhledávání jen v požadovaných sbírkách. Po zadaní jednoduchého dotazu zobrazí se výsledky hledáni, které jsou zároveň roztříděné podle sbírek (viz Obr. 4). Výsledky hledáni je možné seřadit podle datumu zveřejněni, autora, čísla záznamu nebo podle podobnosti slov. Pro každou sbírku je také možné nastavit požadovány počet výsledků. Uživatel může také zobrazit výsledky v jednom seznamu, tj. výsledky nebudou tříděné podle sbírek. Kromě toho uživatel může vybrat výstupní formát výsledků a to citace, HTML brief, HTML brief + PSH, HTML + citesummary, MARC, Refman RIS. (5)

Obr. 4 Obrazovka výsledků hledání v digitálním repozitáři. Zdroj: (8)

Vyhledávání se také dá provádět hned v požadované sbírce nebo zaměření. Na hlavni stránce při výběru konkrétní sbírky nebo zaměření systém nabídne dostupné subkategorie. Po výběru požadované subkategorii zobrazí se dokumenty, které patří do vybrané subkategorii. Následně je možné do vyhledávacího pole zadat libovolný dotaz.

2.1.2. Pokročilé vyhledávání

Pokročilé vyhledávání nabízí pohodlné nástroje pro dotazovaní v digitálním depozitáři. Rozbalovací seznam (viz Obr. 5) umožňuje zadat řetězec slov, který bude vyhodnocený repozitářem jako přesná fráze nebo regulární výraz. Navíc pomoci moznosti „jedno ze slov“ nebo „část výrazu“ v rozbalovacím seznamu systém použije operátor OR pro zadaný řetězec slov. Při rozšířeném vyhledávání je také možné upřesnit v jakém přesně poli musí být vyhledán řetězec slov. Dostupná pole pro vyhledáváni jsou název, autoři, klíčová slova, datum zveřejněni, instituce, typ dokumentu, název konference, ISBN/ISSN, číslo projektu, plny text, číslo záznamu.  Kromě toho repozitář umožňuje použití operátorů AND, OR a NOT. Nakonec záznamy se da filtrovat podle datumu zveřejněni.

Výsledky hledáni se dá seřazovat stejně jako i v jednoduchém vyhledávání. Jednoduché vyhledávání se v zásadě neliší od pokročilého, pokud bude použita speciální syntaxe, která bude vysvětlena v oddílu 2.1.3 Syntax, operátory

Obr. 5 Obrazovka pokročilého vyhledávání v digitálním repozitáři. Zdroj: (8)

2.1.3. Syntax, operátory

Vyhledávání fráze

Pro vyhledávání konkrétní fráze je možné použít uvozovky. Existuji dva režimy vyhledáváni frázi:

  • Dvojité uvozovky („…“) – vyhledávají přesnou frázi. Při použití dvojitých uvozovek zobrazí se pouze výsledky, které se shodují se zadaným řetězcem.
  • Jednoduché uvozovky (‚…‘) – vyhledává dílčí fráze. Tento režim připomíná vyhledáváni fráze v Google vyhledávače. Na rozdíl od dvojitých uvozovek tento režim zohledňuje text, který se nachází za nebo před zadaným kritériem v jednoduchých uvozovkách. (5)
Booleovské operátory

Při vyhledáváni v repozitáři NUŠL je možné použit operátory AND, OR a NOT. Použiti operátoru v dotazech je názorně zobrazené v Tab. 1. (5)

ANDreferenční +modelnalezne všechny záznamy, které obsahuji oba slova
referenční modeltotéž
referenční AND modeltotéž
ORreferenční |modelnalezne všechny záznamy, které obsahuji alespoň jedno slovo
referenční OR modeltotéž
NOTreferenční -modelnalezne všechny záznamy, které obsahuji slovo „referenční“, ale neobsahuji „model“
referenční NOT modeltotéž
Tab.  1 Booleovské operátory. Zdroj: vlastní zpracování, (5)
Kulaté závorky

Vyhledávač také podporuje použití kulatých závorek, které pomáhají sloučit booleovské výrazy do skupin. Je možné použít libovolný počet závorek, uznávají se i vnořené závorky. (5)

Speciální znaky a interpunkce

Vyhledávač v repozitáři také podporuje vyhledaní dotazů se speciálními znaky, například, „C++“ nebo „sin2 2θ13 = 0.084±0.005“. Na druhou stranu vyhledávač nerozlišuje velká a mala písmena. (5)

Mezinárodní znaky

Vyhledavač také rozpoznává Unicode UTF-8 znaky, což umožňuje vytváření dotazů v různých jazycích. (5)

Hledání se zástupným znakem *

Vyhledávač podporuje použití zástupného znaku hvězdička (*). Například, při zadáni model*, hvězdička doplní libovolný počet znaků a nalezne záznamy, které kupříkladu obsahují slova modelovat, modelovaní atd. Hvězdičku se da doplnit i uprostřed slova. (5)

Strukturované metadatové vyhledávání

Vyhledávač také podporuje vyhledáváni v rámci různých bibliografických poli, například author:Puškin, title:model, abstract:model, keywords:model. (5)

2.2. Centrální rozhraní

Centrální rozhraní představuje indexační a vyhledávací systém nad digitálním repozitářem NUŠL a dalšími spolupracujícími repozitáři. Takový přístup je zajištěn open source systémem Elasticsearch. (4)

Vyhledávání v centrálním rozhraní NUŠL probíhá podle navigace umístěné nalevo (viz Obr. 6). Dokumenty je možné vyhledávat podle 5 hlavních kategorií: typ dokumentu, osoby, klíčová slova, jazyk a plný text.

Obr. 6 Centrální rozhraní NUŠL. Zdroj: (7)

Kategorie Typ dokumentu je strukturovaná do dvou úrovní. Například, složka Analytické a metodické materiály, která se nachází v první úrovně se dál děli na analýzy, metodiky a studie, což představuje druhou úroveň děleni.  Další složky nacházející se v první úrovní jsou: Autorské práce, Firemní literatura, Konferenční materiály, Ostatní, Propagační materiály, Vysokoškolské práce a Zprávy. (6)

Kategorie Osoby obsahuje názvy instituce, například Český statistický úřad, Univerzita Karlova nebo jména lidi, které mohou být jak autory dokumentů, tak i například vedoucí vysokoškolských práci. Defaultně jsou vždy zobrazené 4 položky a po stisknuti tlačítka „zobrazit vice“ zobrazí se celkově 20 položek. (6)

Kategorie Klíčova slova obsahuje fráze a terminy v českém a anglickém jazyce. Stejně jako i u kategorii Osoby ve výchozím nastavení zobrazují se 4 terminy a po rozkliknuti se zobrazí dalších 16 terminů.

V kategorii Jazyk se nachází až 8 jazyků na výběr: čeština, angličtina, slovenština, němčina, francouzština, ruština, španělština a polština.

Poslední kategorie Plný text nabízí výběr mezi dokumenty podle dostupnosti plného text. 

Kromě popsaných kategorii, v centrálním rozhraní je také dostupné vyhledávání ve sbírkách, které byly zmíněné výše v podkapitole

2.2.1 Digitální repozitář

Mimoto každá stránka obsahuje časovou osu (viz Obr. 7), které pomáhá omezit výsledky vyhledávaní podle roku. Časová osa také ukazuje počet dostupných dokumentů.

Centrální rozhraní také obsahuje pole pro jednoduché vyhledávaní. Dotaz na vyhledáváni je možné provést postupným problikáváním přes kategorii a sbírky, a následně zadáváním klíčových slov do vyhledávacího pole. Špatnou zvolenou kategorii se da smazat odkliknutím v sekci „Použita omezeni“. Bohužel vyhledávácí pole neumožňuje použití žádných booleovských operátorů nebo jiné syntaxi, která byla popsaná v oddílu 2.1.3. Syntax, operátory. (6)

Výsledky vyhledáváni obsahuji krátkou část textu, seznam autorů a rok vydání dokumentu. Navedením na ikonku s písmenem i (viz Obr. 7) se zobrazí podrobné informace o dokumentu. Informace, které mohou být nalezené v popisu dokumentu jsou typ dokumentu, ISBN/ISSN, rok, jazyk, abstrakt, klíčová slova, práva, instituce, link na externí umístěni souboru a na umístěni v digitálním repozitáři NUŠL. 

Obr. 7 Obrazovka výsledků hledání v centrálním rozhraní NUŠL. Zdroj: (7)

2.3. Typologie dokumentů

NUŠL používá vlastní typologii šedé literatury. Názvy typu dokumentů odpovídají názvům sbírek o kterých už bylo zmíněno výše. Přehledně všechny typy dokumentu jsou zobrazené na Obr. 8. (3)

Obr. 8 Typologie dokumentů. Zdroj: vlastní zpracování, (3)

3. Závěr

Národní uložiště šedé literatury (NUŠL) (7, 8) má obrovský přínos pro vědeckou a výzkumnou činnost, jelikož umožňuje publikovaní, archivovaní a síření výstupy různých producentů informaci. Šedá literatura obsahuje velké množství cenných údajů, které jsou nezbytné pro vědecké a výzkumné účely. Do těchto cenných údajů se řadí zprávy vládních a akademických orgánů, výroční zprávy firem, autorské monografie a sborníky, konferenční materiály atd.

Jedním z přínosu šedé literatury je urychlené zveřejnění materiálů než u klasických publikovaných dílů. Často také výsledky výzkumů jsou popsané podrobněji ve vědeckých zprávách a sbornících než v odborných časopisech. Nakonec některé materiály nemusí být nikdy opublikované, proto jsou takové uložiště šedé literatury velice důležité.

Uložiště šedé literatury má velký přinos nejen pro uživatele, ale i pro producenty, kteří se rozhodli spolupracovat a sdílet své dokumenty. Díky NUŠL jejích autorské díly budou sdílené veřejností a nebudou se obtěžovat byrokratickým omezením. Zveřejněné výsledky výzkumu mohou kromě toho pomoct i vládním organum, které financují tyto výzkumy, vybudovat důvěru s veřejnosti.

Kromě samotného zajištění publikace a archivace dokumentů, NUŠL také podporuje diskuse o šedé literatuře provedením každoročních konferencí.

Použité zdroje:

  1. NUŠL, 2016. Hlavní strana – Národní úložiště šedé literatury (NUŠL). NUŠL [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/
  2. NUŠL, 2016. Definice šedé literatury. NUŠL | Národní úložiště šedé literatury [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/seda-literatura/definice-sede-literatury
  3. NUŠL, 2016. Typologie dokumentů NUŠL. NUŠL | Národní úložiště šedé literatury [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/nusl/typologie-dokumentu-nusl
  4. NUŠL, 2016. Technické řešení NUŠL. NUŠL [online]. 29 leden 2016. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/nusl/technicke-reseni
  5. NUŠL, nedatováno. Průvodce vyhledáváním – Digitální repozitář. NUŠL | Digitální repozitář [online]. [Viděno 7 prosinec 2021]. Získáno z: https://invenio.nusl.cz/help/search-guide
  6. PEJŠOVÁ, Petra, 2010. Národní úložiště šedé literatury (NUŠL). Čtenář – Měsíčník pro knihovny [online]. květen 2010. [Viděno 7 prosinec 2021]. Získáno z: https://www.svkkl.cz/en/ctenar/clanek/2033
  7. NUŠL, nedatováno. Národní úložiště šedé literatury. NUŠL | Národní úložiště šedé literatury [online]. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.cz/
  8. NUŠL, nedatováno. Národní úložiště šedé literatury – Digitální repozitář. NUŠL | Digitální repozitář [online]. [Viděno 7 prosinec 2021]. Získáno z: http://invenio.nusl.cz/
  9. Kontakty, 2016. NUŠL – Národní úložiště šedé literatury [online]. [Viděno 7 prosinec 2021]. Získáno z: https://nusl.techlib.cz/cs/kontakty

Číst více

Další články