Pondělí, 3 listopadu, 2025
Domů Blog Stránka 5

Dark Web: Myths and Realities

0
Black-and-white photo showing a hacker wearing a Guy Fawkes mask on a monitor, symbolizing cyber security threats.

Úvod

Väčšina populácie, ktorá dnes využíva internet, aspoň tuší, čo je Dark Web. Tento pojem je však často nesprávne pochopený a obklopený mnohými mýtmi. Mnoho ľudí ho chápe iba ako miesto používané na nelegálne aktivity, ako je obchod s drogami, obchod so zbraňami alebo nelegálny obsah. Tento pohľad na Dark Web nie je úplne presný a prehliada všetky možné využitia.

Dark Web je jednoducho ďalšia časť internetu, ktorú nemožno nájsť vyhľadávaním v bežných vyhľadávačoch, ako je Google. Na rozdiel od „normálneho“ internetu, kde nájdete takmer nekonečný počet webových stránok, Dark Web je prispôsobený tak, aby jeho užívatelia zostali anonymní. Jeho použitie šifrovania a nástrojov ako Tor, ktoré zakrývajú užívateľov a ich aktivity, ho robí neviditeľným. Dark Web obsahuje záludný obsah, ale existujú aj iné veci, ktoré slúžia dobrému účelu, ako sú platformy, ktoré pomáhajú novinárom a aktivistom v krajinách s obmedzenou slobodou slova.

Táto seminárna práca si kladie za cieľ poskytnúť pohľad na to, ako Dark Web funguje a aké sú ťažkosti s jeho reguláciou a monitorovaním. Samozrejme, že tam sa nachádzajú mnohé nelegálne aktivity, zároveň je dôležité uvedomiť si, že technológie, ktoré umožňujú jeho existenciu, majú aj pozitíva. Chystáme sa tiež diskutovať o tom, ako rôzne krajiny reagujú svojimi zákonmi na tento priestor a či je potrebné vyvažovať redukovanie kriminality a násilia pri zabezpečení internetovej súkromnosti a slobody.

1. Historický kontext a vznik dark webu

Aj keď je dark web relatívne novým fenoménom, má bohatú a zaujímavú históriu. Jeho zriadenie a prevádzka sa zakladajú na pokročilých technológiách, ktoré umožňujú anonymitu a zašifrované pripojenia. V tejto časti sa pozrieme na vznik anonymizačných technológií, prvé trhy na dark webe a zásadné udalosti, ktoré formovali spôsob jeho štruktúry a používania dnes.

1.1 Pôvod anonymizačných technológií

Anonymizácia na internete sa začala vyvíjať ako odpoveď na potrebu bezpečnej komunikácie. Vznik anonymizácie na internete prišiel ako riešenie na dopyt po bezpečnej komunikácii na internete. Tor bol pôvodne navrhnutý a vytvorený americkým námorníctvom v deväťdesiatych rokoch na ochranu vládnej komunikácie. Tor funguje na myšlienke vrstvenej šifrovacej siete, v ktorej sa dáta prenášajú reťazou uzlov, pričom každý oddeľuje jednu vrstvu šifrovania, až kým nedosiahne konečný cieľ. Počas tohto procesu sa skutočná IP adresa utajuje (Christin, 2013). Pôvodným účelom Toru bolo ochrániť citlivé vládne údaje a agentov komunikujúcich v zahraničí. Tor bol vydaný do verejnej domény v roku 2002, čím sa jeho použitie rozšírilo. Bol to však dôležitý posun, pretože anonymita bola dostupná novinárom, aktivistom a tiež ľuďom, ktorí neboli proti zákonu (Moore & Rid, 2016).

 

1.2 Silk Road a jeho dopad

Spustený v roku 2011, Silk Road bol prvým veľkým trhom na dark webe, ktorý implementoval používanie Toru na anonymitu a Bitcoinu na finančné transakcie. Ross Ulbricht pod menom „Dread Pirate Roberts“. Trh ponúkal rôzne produkty, predovšetkým drogy, ale aj iné nelegálne služby, ako sú falošné identifikácie alebo ukradnuté dáta (Aldridge & Décary-Hétu, 2014). Silk Road bol prelomový v niekoľkých ohľadoch:

  • Model dôvery: Na trhu boli vytvorené hodnotenia predajcov a systém úschovy, kde boli platby uskutočnené až po dodaní tovaru kupujúcim. Tento model viedol k veľkému zvýšeniu dôvery medzi predtým anonymnými stranami (Christin, 2013).
  • Ekonomický dopad: Silk Road údajne zarábal až 1,2 milióna dolárov hrubého príjmu mesačne, čo zvýraznilo ekonomickú užitočnosť trhov na dark webe.
  • Silk Road bol zatvorený americkými úradmi v roku 2013 a jeho zakladateľ Ross Ulbricht bol odsúdený na doživotie za mrežami. Ale toto zatvorenie neznamenalo koniec podobných trhov. Skôr sa objavili nové platformy ako AlphaBay a Dream Market, ktoré reprodukovali rovnaký model (Soska & Christin, 2015).

Silk Road sa môže pochváliť viac ako 9,5 miliónmi transakcií (Berge, 2014). Americká vláda tvrdila, že 90 % príjmov Silk Road pochádzalo z legálnych a nelegálnych drog, pričom drogové transakcie dosahovali približne 214 miliónov dolárov (Ministerstvo spravodlivosti USA, 2015).

1.3 Operácia Onymous

V roku 2014 zahájili úrady medzinárodnú operáciu s kódovým označením Onymous, v rámci ktorej zatvorili viac ako 400 webových stránok na dark webe. Táto operácia dokázala, že anonymita Toru nie je absolútna. Úrady využili technické aj legálne stratégie na identifikáciu a uzavretie týchto stránok (Décary-Hétu & Giommoni, 2017). Operácia Onymous bola zmiešaným úspechom. Napriek mnohým zatvoreniam sa nové miesta objavili a dokázali prispôsobiť zvýšeným rizikám. Toto je dokonalá ilustrácia toho, ako je dark web neustále odolný a umožňuje mu prispôsobiť sa vonkajším tlakom.

2. Charakteristika dark webu: Struktúra a technológie

Dark web je špecifická časť internetu, ktorá sa často nesprávne chápe ako priestor výlučne pre nezákonné aktivity. Ako sa ukazuje, sú to len malá zaujímavá časť oveľa väčšieho deep webu. Deep web zahŕňa všetky weby, ktoré nie sú indexované bežnými vyhľadávačmi ako Google a Bing. Veľa na internete je skryté pred bežnými používateľmi. Jeho menšia verzia sa nazýva dark web, ku ktorému je možné pristupovať len pomocou špeciálnych nástrojov a technológií, pričom prehliadanie ponecháva používateľa úplne anonymného. Teraz sa pozrieme na detaily, ako dark web funguje, aké technológie sú potrebné pre jeho fungovanie a aké možnosti poskytuje používateľom.

2.1 Ako funguje dark web?

Dark web, ako naznačuje jeho názov, je miesto, na ktoré sa nedá prístupovať cez základné prehliadače, ako sú Chrome alebo Firefox, ako to robíme každý deň. Potrebujete špeciálne nástroje na prístup na dark web. Táto časť internetu závisí od druhu šifrovania, ktoré zaručuje, že nikto nezistí, kto ste alebo čo robíte. Tor je jedným z najpopulárnejších nástrojov na dosiahnutie dark webu. Tor umožňuje prehliadať anonymné webové stránky s príponou „onion“. Webové stránky, ktoré končia touto príponou, nie sú viditeľné na bežnom internete, čo ich sťažuje sledovanie. Tor tiež šifruje vašu komunikáciu, čo znamená, že vaša aktivita je skrytá pred vonkajším svetom. To sa dosahuje presmerovaním vašej komunikácie cez mnoho serverov (známych ako uzly), čím je ešte ťažšie sledovať (Bernstein, 2015).

Skryté služby Neviditeľný internetový projekt

Ďalšou technológiou dark webu je I2P (Invisible Internet Project). I2P (Invisible Internet Project) je podobný Toru, ale jeho zameranie je na vytvorenie siete, ktorá je oddelená a používaná iba používateľmi I2P. I2P sa používa na vytváranie anonymných stránok, anonymných komunikačných kanálov, kde je ešte ťažšie sledovať, kto sú používatelia (Rashid, 2017).

2.2 Prečo je dark web anonymný?

Anonymita je kľúčovou charakteristikou dark webu. Tor a I2P chránia vašu identitu a aktivitu na internete. Toto je vaša adresa, ktorá funguje ako spojovací bod medzi vami a vaším poskytovateľom internetových služieb (ISP), ale je skrytá. Pri bežnom používaní internetu, napríklad ak navštívite webovú stránku, stránka môže vidieť vašu IP adresu a priradiť túto adresu k tomu, čo robíte. Na dark webe je však takéto sledovanie nemožné, pretože vaše pripojenie je zašifrované a vaša komunikácia sa posiela cez mnoho uzlov, ktoré maskujú vašu IP adresu. Okrem toho sa platby na dark webe často realizujú s kryptomenami ako Bitcoin alebo Monero. Tieto platby zostávajú anonymné a poskytujú veľmi málo informácií o tom, kto skutočne uskutočnil transakciu. Aj keď nie sú úplne anonymné, bitcoin poskytuje nevídanú úroveň súkromia v porovnaní s inými platobnými metódami, ako sú kreditné karty (Zolhar, 2017).

2.3 Čo nájdete na dark webe?

Je bežné, že dark webové stránky sú súčasťou neuzatvorených záhrad; sú tiež spájané so zločinom, špionážou, počítačovou kriminalitou a ďalšími. Niektoré sú nezákonné alebo kontroverzné, hoci nie všetky. Napríklad existujú skutočné komunikačné kanály, ktoré by novinári alebo aktivisti (aby sme menovali len dve profesie) mohli využiť na bezpečné zdieľanie správ alebo informácií. Niekedy sa dark web využíva na ochranu osobných informácií v krajinách, kde sú výrazne obmedzené možnosti vyjadrenia alebo na ochranu pred vládnym sledovaním. Na dark webe môžete nájsť rôzne trhoviská pre drogy, zbrane a dokonca aj zneužité údaje, ako ukradnuté kreditné karty alebo osobné informácie. Okrem toho, že sú oveľa viac skryté a používajú kryptomeny na svoje transakcie, tieto trhoviská sa chovajú veľmi podobne ako bežné online obchody (Binns, 2016).

2.4 Prístup na dark web a riziká

Deep web poskytuje veľa anonymity, ale nič neprichádza bez rizík. Webové stránky na dark webe môžu byť nebezpečné a používatelia sa môžu stať obeťami podvodov alebo iných zločinov. Rovnako môže platiť aj zákon na rôznych webových stránkach, pretože na niektorých z nich môžete vykonávať nezákonné operácie a aktivity. Takže ak budete preskúmavať dark web, robte to s veľkou opatrnosťou a podniknite potrebné opatrenia na zabezpečenie vašich údajov. Pretože dark web pozostáva z anonymnej a nezákonnej aktivity, je kľúčové ostať informovaný o hrozbách, ktoré táto oblasť ponúka, a vyhýbať sa nezákonným alebo neetickým aktivitám (Moore & Rid, 2016).

2.5 Budúcnosť Dark Webu: Technologické a politické faktory

Spýtal som sa Chatgpt 4o akú prepokladá budúcnost dark webu a inkorporáciu umelej inteligencie. Rozvoj umelej inteligencie (AI) a strojového učenia majú potenciál na výrazné zlepšenie schopnosti monitorovať a identifikovať nelegálnu činnosť na internete, vrátane Dark Webu. AI by mohla byť využívaná na detekciu nezákonných trhov, obchodovania s nelegálnym tovarom a ďalších foriem kyberkriminality.

Riziká a výzvy: Rýchly rozvoj šifrovacích technológií môže viesť k tomu, že sa zvýši miera anonymity na Dark Webe, čo by mohol umožniť ďalší rast nelegálnych aktivít, ktoré súťažili o pozornosť. Aj keď to môže byť nevyhnutné na ochranu súkromia, môže to predstavovať výzvu v boji proti kyberkriminalite. Jednou z najväčších výziev pre tvorbu legislatívy týkajúcej sa Dark Webu je nájsť rovnováhu medzi bojom proti kriminalite a ochranou práv jednotlivcov na ochranu súkromia a slobody prejavu. Existujú rôzne návrhy, ako by sa mohla regulácia Dark Webu vyvíjať tak, aby zohľadňovala oba tieto aspekty:

Boj proti kriminalite, regulácia by mala zahŕňať zlepšené techniky monitorovania a identifikácie nelegálnych trhov a zločincov, ktorí používajú Dark Web na svoje aktivity. To by mohlo zahŕňať použitie pokročilých analytických nástrojov a spoluprácu medzi národnými a medzinárodnými orgánmi na odhaľovanie zločinu.

Ochrana súkromia, Súčasne by malo existovať silné právne záruky pre ochranu jednotlivcov, ktorí využívajú Dark Web na legitímne účely. Napríklad novinári, aktivisti, právnici a ďalší, ktorí sú vystavení hrozbám zo strany vlád alebo zločineckých skupín, by mali mať možnosť využívať technológie ako Tor alebo I2P na bezpečnú komunikáciu bez obáv zo zasahovania.

3. Nelegálne aktivity na dark webe

Dark web je často vnímaný ako priestor pre nelegálne aktivity, a to nielen vďaka jeho anonymite, ale aj vďaka tomu, že poskytuje miesto pre obchodovanie s produktmi a službami, ktoré sú na surface webe zakázané.

3.1 Predaj zbraní a nelegálnych služieb

Dark web je trh s drogami. Dôležitou kategóriou sú zbrane a zakázané služby, ktoré môžu zahŕňať:

  • Strelné zbrane a munícia.
  • Falšované doklady vrátane pasov a preukazov identity.
  • Hackeri na prenájom: niektorí hackeri ponúkajú služby ako hackovanie účtov, krádež osobných údajov alebo hackovanie spoločností pre kybernetické útoky (Partman, 2023).

Takéto služby sú často propagované na špecifických fórach alebo anonymných trhoviskách, ktoré umožňujú predajcovi a kupujúcemu komunikovať v šifrovaných správach. Podľa Rashida (2017) sú krádeže dát a hackovanie firemných systémov najžiadanejšími službami.

3.2 Distribúcia nelegálneho obsahu

Na dark webe sa uverejňuje veľmi dark a nelegálny, často neetický obsah. Najvážnejšími problémami sú (okrem iného):

  • Detská pornografia: Tento druh zneužívania je vážna globálna otázka. Anonymita poskytovaná Torom uľahčuje distribúciu takýchto materiálov na dark webe.
  • Násilný obsah: Na dark webe sú webové stránky, kde sa nachádzajú násilné videá alebo iný neetický obsah, ktorý by bol okamžite zakázaný na surface webe.

Právne orgány sa snažia zastaviť tieto aktivity, ale kvôli anonymnej povahe dark webu je ich práca veľmi náročná. Podľa Décary-Hétu a Giommoniho (2017) je dostupnosť takéhoto obsahu na dark webe jedným z hlavných etických problémov týkajúcich sa existencie tejto siete.

3.3 Ekonomika čiernych trhov

Trhoviská dark webu majú podobné koncepty a štruktúry ako ich neanonymné ekvivalenty, ale umožňujú zachovanie anonymity. Tieto závisia od niekoľkých kľúčových faktorov toho, ako tieto trhy fungujú:

  • Anonymné platby: Väčšina transakcií prebieha cez kryptomeny a nie je ľahké ich vystopovať.
  • Systém reputácie: Podobne ako eBay alebo Amazon, zákazníci môžu hodnotiť predajcov a produkty, čo zvyšuje dôveru medzi účastníkmi trhu (Christin, 2013).
  • Systémy pay-backing: Kupujúci pošle peniaze do pay-backu, ktorý peniaze uvoľní predávajúcemu až po tom, čo kupujúci potvrdí, že produkt dorazil podľa očakávaní.

Hoci sa úrady snažia tieto trhy zlikvidovať (pozri: Operácia Onymous), ekonomika dark webu prekvitá a jej trhy sa stávajú stále sofistikovanejšími.

4. Legitímne využitia dark webu

Ako som už spomenul, existujú legitímne využitia dark webu, ktoré sú prehliadané. Často tiež poskytuje používateľom bezpečné miesto na zachovanie slobody prejavu, slobodu slova a prístup k informáciám v krajinách, kde je tento prístup obmedzený.

4.1 Ochrana slobody prejavu

Možno najdôležitejšou funkciou dark webu je poskytnutie anonymity tým, ktorí žijú v krajinách čeliacich cenzúre alebo represiám. V autoritárskych režimoch, kde vlády ovládajú médiá a obmedzujú prístup k nezávislým informáciám, môže dark web poskytovať obyvateľom prístup k cenzurovaným zdrojom.

Príklady využitia dark webu:

  • Obchádzanie cenzúry: „Pomocou nástroja Tor môžu ľudia žijúci v krajine, ako je Čína alebo Irán, obísť vládne bloky, aby získali prístup k zahraničným médiám a nezávislým správam“ (Moore & Rid, 2016).
  • Nezávislá žurnalistika: Mnoho renomovaných médií (The New York Times, The Guardian atď.) používa platformy dark webu (SecureDrop atď.) na zber dôvernej informácie od whistleblowerov.

4.2 Whistleblowing a anonymné nahlasovanie

Dark web hrá kľúčovú úlohu pre whistleblowerov, ktorí chcú zverejniť dôležité informácie o korupcii, porušovaní ľudských práv alebo iných nespravodlivostiach, ale boja sa stíhania.

Oznamovanie sa vykonáva na mnohých platformách:

  • SecureDrop: Táto stránka dark webu umožňuje reportérom a organizáciám akceptovať anonymné podania informácií. Je to bezpečné miesto, kde môžu whistlebloweri nahlasovať problémy bez obavy z identifikácie.
  • WikiLeaks: Stránka WikiLeaks je známa publikovaním veľkého množstva tajných dokumentov vrátane dokumentov odhaľujúcich korupciu a zneužívanie moci v rôznych krajinách. Tento krok už bol vykonaný pre niektoré dokumenty, ktoré boli zverejnené prostredníctvom dark webu takým spôsobom, že bola zachovaná anonymita whistleblowerov a anonymity aktivistov, ktorí tieto dokumenty poskytli. Použitím siete Tor WikiLeaks zabezpečilo, že informátori zostanú anonymní a v bezpečí (Zetter, 2013).
  • Zamestnanci veľkých korporácií alebo vládni zamestnanci používajú tieto platformy na odhalenie korupcie alebo zneužitia moci.

 

4.3 Bezpečná komunikácia a ochrana súkromia

Dark web má svoj vlastný význam pre ľudí, ktorí potrebujú ochranu súkromia. Toto nemusí byť nevyhnutne spojené s nelegálnymi aktivitami, ale často pre zdanlivo platné dôvody, ako je ochrana pred sledovaním.

Príklady využitia:

 Podpora aktivistov: Občianski aktivisti môžu použiť dark web na bezpečné plánovanie protestov alebo kampaní v krajinách, ktoré potláčajú politickú opozíciu.

Ochrana osobných údajov: Jednotlivci používajú dark web na ochranu pred komerčným alebo vládnym sledovaním (Bernstein, 2015).

4.4 Akadémia a výskum

Navyše, akademické a výskumné inštitúcie tiež využívajú dark web na analýzu rôznych javov týkajúcich sa kyberzločinu, anonymity a technologických implementácií.

Oblasti výskumu:

  • Dohľad nad čiernymi trhmi: Vedci skúmajú trhoviská na dark webe, aby lepšie pochopili, ako fungujú a ako sa dá predchádzať takýmto nekalým aktivitám (Christin, 2013).
  • Výskum bezpečnostných technológií: Dark web funguje ako ihrisko pre testovanie nových anonymizačných a šifrovacích technológií.

Komunitné fóra a alternatívne využitia

Dark web tiež obsahuje komunity, ktoré nie sú spojené s kriminalitou. Tieto môžu byť fóra alebo platformy, kde sa ľudia zhromažďujú okolo rovnakých záujmov. Komunity, ktoré diskutujú o technológiách, spôsoboch ochrany súkromia alebo spoločenských témach.

4.5 Komunitné fóra a alternatívne využitia

Existujú tiež komunity na dark webe, ktoré sú prinajlepšom neutrálne. Sú to platformy alebo fóra pre rovnako zmýšľajúcich ľudí. Takéto komunity môžu diskutovať o technológiách a ochrane súkromia, alebo sa môžu sústrediť na sociálne otázky.

5. Mýty verzus realita

Okolo dark webu existuje veľa mýtov a mylných predstáv, zvyčajne kvôli nedostatku informácií alebo mediálnemu rozruchu.

5.1 Mýtus: Dark web je úplne anonymný

Mýtus o dark webe je, že ponúka úplnú anonymitu. Ale anonymita na dark webe závisí od množstva faktorov, vrátane toho, ako používateľ využíva nástroje ako Tor alebo kryptomeny. Tor a podobné anonymizačné technológie môžu udržať identitu používateľa v bezpečí, ale stále nie sú zárukou proti kompromitácii. Sú to technologické a ľudské chyby, nesprávne konfigurácie alebo bezmyšlienkovité správanie, ktoré môžu odhaliť identitu používateľa (Christin, 2013).

Napríklad v prípade Operácie Onymous, keď bolo zrušených niekoľko trhov na dark webe, orgány presadzovania práva úspešne vystopovali používateľov a administrátorov prostredníctvom zmesi technických a sociálnych metód (Décary-Hétu & Giommoni, 2017).

5.2 Mýtus: Celý dark web je kriminálny

Médiá poskytujú predstavu, že dark web je určený len na nelegálne aktivity, či už ide o dílerov drog, obchodníkov so zbraňami alebo pedofilov. Hoci takéto aktivity na dark webe existujú, nie sú jeho jediným obsahom. Ako bolo uvedené v kapitole 4 (Legitímne využitie dark webu), veľká časť dark webu je využívaná na legitímne účely.

5.3 Mýtus: Na dark web je jednoduché sa dostať a využívať ho

Mnohí považujú dark web za ľahko dostupný a bezpečný internetový svet, ktorý možno jednoducho používať. Toto myslenie však prehliada technickú zložitosť a riziká jeho fungovania v zákulisí. Aby mali používatelia prístup k dark webu, musia nainštalovať a nakonfigurovať softvér, ako je Tor, čo nie je vždy užívateľsky najpríjemnejší proces. Prekonfigurovaná identita môže viesť k odhaleniu (Rashid, 2017).

Okrem toho niektoré webové stránky na dark webe môžu obsahovať vírusy alebo škodlivý obsah, ktorý môže ovplyvniť zariadenia používateľa.

5.4 Mýtus: Dark web je obrovský a zahŕňa väčšinu internetu

Ďalšia mylná predstava je, že dark web tvorí hlavnú časť internetu a obsahuje viac dát, než si vieme predstaviť. (Tento názor pravdepodobne vznikol z toho, že si ľudia zamieňali dark web s deep webom.) Dark web je malá podmnožina deep webu. Deep web zahŕňa všetko, čo nie je indexované vo vyhľadávačoch, ako sú databázy, interné systémy a súkromné siete (Binns, 2016).

Bolo odhadnuté, že dark web tvorí menej ako 0,01 % z celkového obsahu internetu, ale má význam a vplyv, ktorý je neúmerný kontroverziám okolo neho.

5.5 Mýtus: Dark web je nezničiteľný

Dark web je niektorými vnímaný ako nepreniknuteľná oblasť mimo dosahu zákona. Neberú však do úvahy úspešné zásahy orgánov presadzovania práva. Uzavretie Silk Road alebo operácie ako Onymous ukazujú, že dark web nie je nezdolateľný. Tento dokument poskytuje historický kontext vývoja kyberkriminálnych aktivít a snáh o prerušenie týchto aktérov, ktoré zahŕňali identifikáciu kľúčových aktérov a zatvorenie niektorých z najväčších platforiem (Décary-Hétu & Giommoni, 2017).

To povedané, dark web je obzvlášť robustný a má tendenciu rýchlo sa prispôsobiť novým okolnostiam. Zakaždým, keď je jeden trh zatvorený, často je otvorený ďalší s lepšími bezpečnostnými postupmi.

Okolo dark webu krúžia mnohé nepravdivé tvrdenia, mnohé z nich prehnané a nereprezentatívne jeho skutočnú povahu. Je súčasne jedným z najneprehľadnejších miest na Zemi – je hojne spojený s „zločinom“ a anonymitou – ale samozrejme nie je „zločinný“ alebo „anonymný“. Existujú aj pomerne pozitívne využitia dark webu, ktoré by nemali byť prehliadané. V snahe porozumieť tomuto údajnému fenoménu internetu by sme mali oddeliť fakty od fikcie.

6. Právne aspekty a regulačné výzvy

Právna regulácia dark webu je dôležitou otázkou pri presadzovaní práva, aby sa bojovalo proti nelegálnej činnosti, ale aj aby sa reflektovali etické a právne výzvy. Zákony o kryptomenách, štatúty o anonymnom prehliadaní a zásahy proti nelegálnym aktivitám môžu hrať významnú úlohu v regulácii a pochopení dark webu. Rôzne krajiny a ich súdne systémy sa vzťahujú k existencii dark webu na základe problémov, ktorým čelia.

Právne výzvy

V mnohých z nich sú legislatívne rámce vytvorené na boj proti nelegálnym procesom, ktoré sa odohrávajú na dark webe, ako je pranie špinavých peňazí alebo predaj drog. USA a EÚ, napríklad, majú prísne regulácie týkajúce sa kryptomien, ktoré sa používajú na množstvo nelegálnych transakcií na dark webe. Ako uvádza Zohar (2017), právna regulácia na rôznych územiach bojuje o dosiahnutie optimálnej rovnováhy medzi ochranou súkromia a reguláciou/trestaním trestných činov spojených s používaním kryptomien a darknetu. Okrem toho sa veľká pozornosť venuje legislatíve o počítačovej kriminalite týkajúcej sa dark webu a právnym prekážkam, s ktorými sa stretávajú globálne autority, ktoré sa pokúšajú monitorovať nelegálne aktivity (Moore & Rid, 2016).

Zákony na ochranu súkromia

Ďalší názor na dark web je, že slúži na ochranu súkromia používateľov a pre niektorých používateľov môže byť jediným spôsobom, ako sa chrániť pred vládnym dohľadom a hromadným sledovaním. To vytvorilo právnu dilemu medzi ochranou súkromia a prevenciou trestnej činnosti. Brenner, S.W. a Kunder, C.M. (2015), Beztvárový počítačový zločinec: Navrhovanie zákona o počítačovej kriminalite bez podkopávania potreby poriadku, 39 [3] R. St. U. L. Rev. 793 (vysvetľujúc, že snaha zachovať anonymitu na internete je spojená so spoločenskými problémami, ktoré prichádzajú s možnosťou skrývať sa za obrazovkou, ako sú počítačové/kriminálne aktivity, čo vyvoláva debatu o vývoji zákonov o ochrane súkromia bez ničenia poriadku vo verejnom priestore). Na druhej strane, podľa Sharmana (2018) musí byť legislatíva navrhnutá tak, aby poskytovala rovnováhu medzi právom na súkromie a potrebou stíhať trestné činy v prípadoch zneužitia technologických nástrojov.

Záver

Dark web je mnohostranná, hoci často nesprávne chápaná súčasť internetu, ktorá spája rôzne aspekty sveta. Aj keď je známym pre nelegálne trhy a služby, ukazuje, že vo sférach, ktoré sú životne dôležité pre zabezpečenie základných ľudských práv, ako je sloboda prejavu a anonymita, má preukázateľné využitie. Mali by sme sa snažiť o viacnuansované pochopenie dark webu a vyhnúť sa jednostranným hodnoteniam, ktoré ho charakterizujú len ako liaheň kriminality. Jeho anonymizačné technológie — vrátane Tor a I2P — chránia novinárov, aktivistov a ľudí žijúcich v represívnych režimoch, ktorí by inak čelili cenzúre alebo prenasledovaniu. Ak je regulácia takejto činnosti skutočne zložitá, a výzvy v používaní aktivity dark webu na nelegálne účely sú rozmanité, je kľúčové dosiahnuť rovnováhu medzi ochranou súkromia v porovnaní s ochranou ľudí pred počítačovou kriminalitou. Aj keď dark web predstavuje určitú hrozbu, ukázal sa tiež ako odolný voči pokusom o zásah a preukázal proces neustálej adaptácie na tieto protiopatrenia. Keď sa technológie neustále vyvíjajú a v boji o ochranu dát sa už automatizujú, dark web sa pravdepodobne stane čoraz dôležitejší v oblasti digitálnej bezpečnosti a slobody prejavu. Napriek tomu, že táto aplikácia má svoje výhody, nemali by zatieniť nebezpečenstvá, ktoré predstavuje, najmä keď sú tam prítomné nelegálne aktivity. Dôsledné, vyvážené monitorovanie a regulácia v tejto oblasti sú dôležité, zabezpečujúce, že sa rovnakej dôležitosti prikladá ochrane súkromia, ako aj právu na prístup k informáciám. Na záver, dark web nie je len liaheň pre zločincov, ale je tiež významným nástrojom v úsilí o základné ľudské práva s technológiami, ktoré môžu uľahčiť transparentnosť a ochranu v globalizovanej spoločnosti.

Zdroje

Christin, N. (2013). Traveling the Silk Road: A measurement analysis of a large anonymous online marketplace. Proceedings of the 22nd International Conference on World Wide Web, 213-224. https://doi.org/10.1145/2488388.2488408

Aldridge, J., & Décary-Hétu, D. (2014). Not an ‚Ebay for Drugs‘: The cryptomarket ‚Silk Road‘ as a paradigm shifting criminal innovation. British Journal of Criminology, 54(4), 688-709. https://doi.org/10.1093/bjc/azu063

Moore, D., & Rid, T. (2016). Cryptopolitik and the Darknet. Survival, 58(1), 7-38. https://doi.org/10.1080/00396338.2016.1142085

Berge, E. (2014, November 3). The Silk Road: A timeline of an online drug marketplace. Wired. Retrieved from https://www.wired.com

U.S. Department of Justice. (2015, May 29). Ross Ulbricht sentenced to life in prison. U.S. Department of Justice. Retrieved from https://www.justice.gov/opa/pr/ross-ulbricht-sentenced-life-prison

Décary-Hétu, D., & Giommoni, L. (2017). Do police crackdowns disrupt drug cryptomarkets? A longitudinal analysis of the effects of Operation Onymous. Crime, Law and Social Change, 67(1), 55-75. https://doi.org/10.1007/s10611-016-9644-4

Zetter, K. (2013, June 10). The dark web’s role in WikiLeaks and digital activism. Wired. Retrieved from https://www.wired.com/2013/06/dark-web-wikileaks/

Soska, K., & Christin, N. (2015). Measuring the longitudinal evolution of the online anonymous marketplace ecosystem. Proceedings of the 24th USENIX Security Symposium, 33-48. https://www.usenix.org/system/files/conference/usenixsecurity15/sec15-paper-soska-updated.pdf

Bernstein, D. J. (2015). The architecture of Tor: The onion routing system. ACM Transactions on Information and System Security, 18(4), 1-17. https://doi.org/10.1145/2790033

Binns, A. (2016). The hidden world of dark web marketplaces. Journal of Financial Crime, 23(1), 56-74. https://doi.org/10.1108/JFC-03-2015-0021

Rashid, F. Y. (2017). I2P: Invisible Internet Project as an alternative to Tor. Proceedings of the 14th International Conference on Network and Service Management, 128-133. https://doi.org/10.1109/CNSM.2017.8490630

Zohar, A. (2017). Monero: The future of cryptocurrency and privacy. Journal of Financial Cryptography, 21(3), 215-234. https://doi.org/10.1007/s10207-017-0357-4

Brenner, S. W., & Kunder, S. (2015). Dark Web crime and law enforcement: A global approach. Journal of Law and Cyber Security, 3(4), 78-92. https://doi.org/10.1093/jlcl/cxx034

Sharman, J. (2018). Cryptocurrencies, crime, and law enforcement. Journal of Financial Crime, 25(3), 574-588. https://doi.org/10.1108/JFC-01-2017-0015

Partman, T. (2023). Nelegálne trhy na Darkwebe (Bakalárska práca). Masarykova univerzita. https://is.muni.cz/th/ojkfa/partman_tomas-cierne_trhy_na_darkwebe_455513_partman_nal.pdf

AI optimalizace CI a využití prompt engineeringu

0
pattern, squares, colorful, background, perspective, intersections, book scrapping, texture, grid, mosaic, tessellation, composition, depth, symmetry, repetition, alignment, overlay, layering, geometry

Úvod

Pod pojmem konkurenčního zpravodajství (angl. Competitive Intelligence, dále jen CI) rozumíme proces shromažďování, analýzy a následné interpretaci informací no nově zjištěná fakta (Bloomenthal, 2022). CI může být dobrou pomůckou jednotlivcům, no pro firmy je důležité pro pochopení a navigaci v konkurenčním prostředí. Tento proces se zaměřuje na analýzu trhových trendů, sledování konkurenční činnosti a identifikaci faktorů, které mohou ovlivňovat pozici organizace na trhu. Následná identifikace rizik a nových příležitostí přináší benefity pro strategické rozhodování.

CI proces je ale s narůstajícím objemem dostupných dat a zvyšující se komplexností trhů, tradiční metody průzkumu a analýz se stávají méně efektivními. V tomhle kontextu se může umělá inteligence (angl. Artificial Intelligence, dále jen AI) jeví jako skvělý nástroj na zlepšení a optimalizaci CI. Od zautomatizování sběru volně přístupných dat po jejich analýzu. AI může také nacházet skryté vzorce chování trhu mezi milióny záznamy (Walton, 2024), nebo přesněji navrhnout model pro predikci budoucího stavu (Mike, 2021), které by člověk za svůj život nenašel.

S využitím AI se ale ponouká taky otázka na její správné využití a optimalizaci. Tuto otázku může zčásti odpovědět disciplína dotazového inženýrství (angl. Prompt Engineering), která je zaměřená na návrh a zefektivnění neboli optimalizaci vstupu pro generativní AI modely, jako třeba velké jazykové modely (angl. Large Language Model, dále jen LLM) (Bozkurt, 2024). Cílem je tedy prozkoumat, jak může AI a prompt engineering společně pomoci optimalizovat a zlepšit procesy CI. Představíme možné oblasti implementace AI technologií za pomoci technik prompt engineeringu a poskytneme doporučení pro jejich integraci do CI procesů. Aby organizace mohly plně využít jejich potenciál. Tento přístup by měl společnostem umožnit rychlejší a přesnější rozhodování, lepší pochopení konkurenčního prostředí a zvýšenou adaptabilitu na tržní změny.

Role AI v optimalizaci CI

AI přináší do procesů CI zásadní změny z pohledu rychlosti zpracovávání dat a také jejich objemu. Přináší taky schopnost identifikace vzorů a poskytnutí predikce budoucího vývoje trhu (Taherdoost & Madanchain, 2023)
. Tato kapitola podrobně popisuje klíčové oblasti uplatnění AI v CI:

  • Automatizovat sběr dat: Nástroje jako Meltwater nebo Crayon sledují média a webové stránky konkurence v reálném čase.
  • Analyzovat data: Algoritmy strojového učení identifikují trendy, korelace a nové příležitosti ve velkých datových souborech.
  • Predikovat budoucí vývoj: Modely jako Prophet umožňují odhadnout sezónní výkyvy nebo změny na trhu.

Na tyto jednotlivé role se může použít škála modelů a typů AI, mezi základné rozdělení a budeme uvažovat následující:

  • Strojové učení (angl. Machine Learning) – Zpracování historických dat, analýza konkurence, identifikace vzorů a generování predikcí.
  • Zpracování přirozeného jazyka (angl.Natural Language Processing) – Dovoluje analýzu a interpretaci textu z různých zdrojů jako články, sociální média nebo dokumenty. Může sloužit na analýzu sentimentu nebo sumarizaci správ a automatické generování přehledů.
  • Generativní AI – Modely LLM, jako GPT-4, produkují textové výstupy na základě dotazů. Mohou automatizovat generování CI analýz nad velkým množstvím dat, dále simulovat tržní situaci a predikci dopadů plánovaných změn. Generování personalizovaných reportů a analýz nejvíce ovlivňuje správné zadávaní dotazů – prompt engineering.
  • Prediktivní modely – Je konkrétní kombinace machine learningu a statistických modelů k odhadování budoucnosti na základě historických dat.
  • Počítačové viďení (angl. Computer Vision) – Může pomoct monitorovat, analyzovat a interpretovat produktových změn na stránkách konkurence, analýza reklamních kampaní nebo analýza zákaznických reakcí z veřejných prezentací.

Každý z uvedených podtypů AI přináší unikátní funkcionality pro zlepšení CI, no dopady jejich použití se dají shrnout do 3 výstupů:

  • Zrychlení analýzy.
  • Přesnost predikcí.
  • Komplexní pohled na trh.

Avšak je nutno dodat, že takovéto použití modelů je třeba brát se zodpovědností a nenasazovat nové modely bez rozmyslu a rozsáhlého testování. Nejnovější zjištění ukazuje schopnost LLM modelů, jako o1, Claude 3.5 Sonnet, Claude 3 Opus, Gemini 1.5 Pro, and Llama 3.1 405 B, jsou do jisté míry klamat a ohýbat pravdu na základě nekalé práce s daty pro jejich vlastní prospěch (Meinke, Schoen, & spol., 2024).

Automatizace sběru dat

Automatizace tohoto proces je klíčové, snižuje totiž zátěž lidských analytiků a zrychluje proces CI. Mezi již existující nástroje můžeme zařadit:

  • Meltwater – Monitoruje média a analýza sentimentu v reálném čase. Zahrnuje škrábání dat z webů (angl. Web Scraping) správ, blogů a sociálních sítí.
  • Crayon – Monitoruje konkurenci, změny na webu, marketingové a PR kampaně.
  • Talkwalker – Specializace na sledování sociálních sítí a analýzu názoru veřejnosti.

Automatizace umožňuje sběr dat v reálnem čase, které mohou být ihned zpracovávány, což poskytuje rychlejší a přesnější podklady pro strategické rozhodování (Taherdoost & Madanchain, 2023).

Analýza dat

AI umožňuje hlubší analýzu dat pomocí strojového učení a pokročilých algoritmů, v reálném čase. Tyto schopnosti mohou poskytnout konkurenční výhodu prostřednictvím identifikace trendů a korelací které jde vidět jen z pohledu na miliony záznamů. Přičemž existuje množství nástrojů zaměřených na analýzu sociálních trendů (Skill Upwards, 2023):

  • Brandwatch.
  • Hootsuite Insights.
  • Crimson Hexagon.
  • Sprout Social.
  • NetBase Quid.

Tyto nástroje nabízejí širokou škálu funkcí, jako je analýza sentimentu, sledování zmínek o dané značce nebo monitorování trendů, a to vše rovněž jak při sběru dat, jde dělat v reálnem čase. AI algoritmy dokážou také segmentovat trhy a zákazníky dle podobnosti chování, což umožní přesněji cílit marketingové kampaně (Bhagat, Singh, Bhandari, & Lal, 2024). Tyto techniky dokážou detekovat jinak skryté vzory a následnou smysluplnou segmentaci zákazníků, která by běžnému lidskému analytikovi unikla.

Prediktivní analytika

Prediktivní modely na bázi AI již pomáhají společnostem odhadovat budoucí chování trhu, vývoj konkurence a preference zákazníků. Dovolí nám tedy předem přizpůsobit naši strategii na základě datových predikcí (Taherdoost & Madanchain, 2023). Mezi také modely patří například:

  • Prophet (open-source model od Mety) – Ponouká predikci časových radů, jako jsou sezónní výkyvy cen u konkurence a predikovat změnu poptávky na trhu.
  • H20.ai – Na základě strojového učení modeluje trhové podíly konkurence a dokáže předpovědět jejich vývoj.

Tento druh analytiky nám tedy umožňuje nejen reagovat na trhové změny, ale také aktivně předcházet a připravit se na potenciální hrozby.

Výzvy implementace AI v CI

Implementace AI v CI přináší revoluční změny, no čelí vícerým výzvám i etickým otázkám:

  • Závislost na technologiích – Spoléhání na AI může vést k ztrátě know-how, nebo i úplné eliminaci analytických schopností.
  • Etické problémy – Sběr a prodej osobních údajů nebo sledování zákazníků, může vyprovokovat zpřísnění legislativy na ochranu soukromí a GDPR.
  • Šum dat – Velký množství nerelevantních a nepřesných údajů, analyzované za vidinou skrytého vzorce chování, může zcela skreslit analýzu a vést k chybným závěrům.
  • Zaujatost dat – Jestliže bude AI trénované na zaujatých datech, analýza a predikce mohou vést k nesprávným nebo neetickým výstupům.

Dnešní technologický výzkum ukazuje, že tyto technologie bude muset dříve nebo později většina společností, pro zachování konkurence schopnosti. Je teda nutné dbát na to, aby byli tyto problémy řešeni předem a aby se AI v rámci CI nevyužívala neetickým způsobem (Poth, 2020).

Potenciál prompt engineeringu v CI

Dle definice se prompt engineering opisuje jako soubor klíčových zručností pro efektivní interakce s LLM modely. Poskytuje instrukce, které prosazují pravidla, automatizují procesy a umí také zabezpečit požadované výstupní vlastnosti (White & spol., 2023).

Tato disciplína se tedy zaměřuje na návrh a optimalizaci vstupních dotazů pro generativní AI modely (angl. prompt). Cílem je dosáhnutí požadované vstupy, které budou co nejvíce relevantní. V praxi jde o starostlivou formulaci instrukcí, otázek nebo popisů, kterých účel je usměrnit AI model k vyprodukování kvalitního výstupu (IBM, 2024). Tato disciplína, při dostatečném výzkumu a vzdělávání, může pomoct k dosáhnutí plného potenciálu AI (Černý, 2024).

Při získávaní informací o konkurenci pro strategické rozhodování, může prompt engineering výrazně zvýšit efektivitu a přesnost získávaných poznatků. Správně navržené prompty umožňují AI modelům efektivněji identifikovat relevantní informace. Pro pochopení prompt engineeringu a zlepšení našich požadavků, nám podle článku (Altus, 2024) může pomoct i tato sada pravidel:

  • Konkrétnost – Je důležité být konkrétní nebo upozornit co nechceme.
  • Kontext – Jak bude odpověď použita, v jakém kontextu je náš dotaz.
  • Zadání role – Stanovení role, jak má AI vystupovat a nahlížet na problém.
  • Jasnost a stručnost – Rozdělení úkol na kroky a odstraňme nejasnosti.
  • Příklady – Jestli jde o komplexní problém, pomůže příklad výstupu, který očekáváme.
  • Formát – Stanovení formátu, délky výstupu.
  • Iterování – Tvorba správného výstupu může trvat několik iterací. Můžeme iterovat úplně od nuly nebo můžeme vypíchnout dobré a špatné části.

Tato sada pravidel je užitečná no ne vždy potřebná a existuje mnohem víc technik. Každá má své využití a přístup při tvorbě dotazů (viz. Tabulka 1) (Aryani, 2023).

#NázevPopis
1Zero-Shot učeníZadání úkolu bez předchozích příkladů. Podrobný popis výstupu bez předchozích znalostí AI o daném úkolu
2One-Shot učeníS výzvou uvedeme jeden příklad, pro pochopení kontextu a formátu, který očekáváme.
3Few-Shot učeníPoskytnutí několika příkladů (2–5), pro pochopení vzoru nebo stylu odpovědi.
4Chain-of-ToughtZažádáme o detailní popis myšlenkového pochodu krok za krokem. Využití má při složitých argumentačních úlohách.
5Iterativní dotazováníJde o proces vedení AI k požadované odpovědi skrz několik iterací.
6Negativní dotazováníŘíkáme, co AI dělat nemá, například určíme, jaký obsah v odpovědi nemá být.
7Hybridní dotazováníKombinujeme různé metody a několikanásobný myšlenkový řetězec.
8Dotazovací řetězeníRozložíme složitý úkol na menší podněty a následně řetězíme výstup do konečné odpovědi.
Tabulka 1 přehled 8 technik dotazování (Aryani, 2023)

Role a využití prompt engineeringu v CI

Prompt engineering v CI může organizacím umožnit využívaní generativní AI pro efektivnější a přesnější analýzu konkurenčního prostředí. Systematickým navrhováním vstupů můžeme více stabilizovat výstupy LLM modelů, jako jsou GPT-4, Claude nebo LLaMA, k vytváření kvalitních, kontextově relevantních výstupů, které optimalizují CI procesy. Překlenuje tak propast mezi lidským záměrem a výstupem AI. Může přizpůsobit generativní schopnosti dle konkrétních cílů CI které chceme dosáhnout.

Zlepšení sběru dat

Upřesněním datových zdrojů můžeme pomoct AI extrahovat jen relevantní data z
rozsáhlých nestrukturovaných zdrojů. Například zaměřením jen na konkrétní typ dat, jako jsou zpravodajské články, tržní zprávy a příspěvky na sociálních sítích.

Techniky, jako je Chain-of-Tought, nám umožní postupné shromažďování informací, což zvyšuje jejich spolehlivost (Chen, Zhang, Langrené, & Zhu, 2024).

Analýza dat

Integrací komplexních dotazů, které budou AI vést logickým uvažováním, můžeme lépe izolovat vhodná data a odvozovat trendy, korelace z rozsáhlých souborů dat, které by při manuální analýze byly často přehlédnuty. Například nastavením role AI při analýze, můžeme simulovat odborný pohled z více perspektiv a vytvořit tak hlubší hodnocení konkurence (Bozkurt, 2024).

Strukturované dotazy umožní LLM vytvoření matice neboli SWOT analýzy z vícerých zdrojů dat. Podněty typu Zero-Shot nebo Few-Shot mohou vést AI modely k vyhodnocení kampaní bez rozsáhlý potřeby trénovaní.

Usnadnění predikce

Pokročilé dotazy mohou pomoct nasměrovat AI k předpovědi trendů v odvětví nebo
předvídání chování konkurentů na základě známých finančních vzorců, dle historického vývoje dané společnosti a také simulace, kdyby se firma chovala jako unicorn nebo korporát.

Prompt engineeringem můžeme také simulovat různé trhové podmínky a připravit se na různé scénáře. Například podněty na stav trhu s vlnou nové pandemie, nebo zhoršení podmínek a inflace v krajině.

Výzvy implementace prompt engineeringu v CI

V implementací prompt engineeringu se krom problému imlpementace AI potýkat také se sadou nových problémů. Jedním z kritických je riziko neobjektivního nebo neúplného výstupu v důsledku chybného návrhu dotazu. Na řešení těchto problémů budou muset organizace přistoupit systematicky a jedním z prvých kroků bude vyškolení týmu v pokročilých technikách prompt engineeringu. Součástí by měla také být sada etických usměrnění pro používání údajů a interakci s AI. Možností je i také doporučení technik nebo konkrétní struktura pro formulaci dotazů. Posledním problémem je taky potřeba ověřování výstupů AI, pro zabezpečení jejich spolehlivosti. Jelikož podobný druh dotazů by měl dávat podobné výsledky.

Závěr

Optimalizace procesů CI za pomoci AI a technik promp engineeringu, představuje
revoluční přístup k analýze konkurenčního prostředí. V praxi již vidíme mnoho firem, které se orientují na sledování a sběr dat nebo i následnou analýzu pro potřeby CI. Můžeme tedy předpokládat, že s technologickým vývojem se i procesy CI z větší části plně automatizují a na lidech ostane jenom kontrolní část výstupů AI.

Tato optimalizace umožní rychlejší a efektivnější zpracování velkých objemů dat. Můžeme očekávat posun a další vývoj automatizace sběru dat, následnou analýzu a predikční modely. Tyto technologie již zvyšují schopnost předvídat trendy a chování konkurence. Zároveň je třeba přistupovat k adaptaci nových modelů zodpovědně a nasazovat jen plně otestované modely.

No i když tyto technologie přinášejí výrazné výhody, je klíčové přistupovat k jejich implementaci s důrazem na transparentnost, etiku a neustálé vzdělávání. Další výzkum a rozvoj těchto technik budou nezbytné pro jejich plné využití a maximalizaci přínosů pro společnost.

Zdroje

Altus, A. (21. August 2024). Outshif. Načteno z Prompt intelligence vs. prompt engineering:
Understanding the differences: https://outshift.cisco.com/blog/prompt-intelligenceversus-prompt-engineering
Aryani, A. (2. December 2023). Medium. Načteno z 8 Types of Prompt Engineering:
https://medium.com/@amiraryani/8-types-of-prompt-engineering-5322fff77bdf
Bhagat, A., Singh, N., Bhandari, P., & Lal, Y. A. (2024). AI-Powered Customer Segmentation For
Marketing.
Bloomenthal, A. (31. December 2022). Competitive Intelligence: Definition, Types, and Uses.
Načteno z Investopedia: https://www.investopedia.com/terms/c/competitiveintelligence.asp
Bozkurt, A. (2024). Tell Me Your Prompts and I Will Make Them True: The Alchemy of Prompt
Engineering and Generative AI. Anadolu University, Türkiye.
Černý, J. (2024). Prompt Engineering: Tactics and Techniques in Open-Source Intelligence.
Journal of Information Warfare. Načteno z Prompt Engineering: Tactics and Techniques in
Open-Source Intelligence: https://www.jinfowar.com/journal/volume-23-issue3/prompt-engineering-tactics-techniques-open-source-intelligence
Chen, B., Zhang, Z., Langrené, N., & Zhu, S. (2024). Unleashing the potential of prompt
engineering in Large Language Models: a comprehensive review.
IBM. (2024). IBM. Načteno z What is prompt engineering?: https://www.ibm.com/topics/promptengineering
Jennewine, T. (2. December 2024). Nasdaq. Načteno z Prediction: Nvidia Stock Will Soar in 2025,
and Not Just Because the AI Boom Is Building Steam:
https://www.nasdaq.com/articles/prediction-nvidia-stock-will-soar-2025-and-not-justbecause-ai-boom-building-steam#:~:text=nvda%20%2D1.81%25-
,Prediction%3A%20Nvidia%20Stock%20Will%20Soar%20in%202025%2C%20and%20N
ot%20Just,AI%20Boom%20Is%20Building%20Steam&
Meinke, A., Schoen, B., & spol., a. (2024). Frontier Models are Capable of In-context Scheming.
Mike, K. (15. December 2021). Marketing Artificial Inteligence Institute. Načteno z AI for
Competitive Intelligence: What You Need to Know:
https://www.marketingaiinstitute.com/blog/ai-for-competitive-intelligence
Poth, R. (2020). Implementation of Artificial Intelligence and Machine learning in Financial
services. International Journal of Engineering and Technology, 3186-3193.
Skill Upwards. (4. July 2023). Skill Upwards. Načteno z Top 7 AI Tools for Analyzing Social Media
Trends: https://skillupwards.com/blog/ai-tools-for-analyzing-social-media-trends
Taherdoost, H., & Madanchain, M. (2023). Artificial Intelligence and Sentiment Analysis: A
Review in Competitive Research. Artificial Intelligence Models, Tools and Applications
with A Social and Semantic Impact.
13
Walton, A. (8. May 2024). Competitive Intelligence Alliance. Načteno z What competitive
intelligence tasks is AI good for?: https://www.competitiveintelligencealliance.io/aicompetitive-intelligence-tasks/
White, J., & spol., a. (2023). A Prompt Pattern Catalog to Enhance Prompt Engineering with
ChatGPT.

Rizika umělé inteligence, o nichž se tolik nemluví. Reaguje na ně lépe evropská či americká legislativa?

0
UI
UI

Úvod

V poslední době se v mediálním prostoru velmi často objevuj diskuze o nebezpečí umělé inteligence. Ta bývá definována jako „technologie, jež umožňuje počítačům a strojům simulovat lidské učení, porozumění, řešení problémů, rozhodování, kreativitu a samostatnost“ (Stryker, 2024) (pro stručnost bude nadále používána zkratka UI). V praxi je to ovšem o dost složitější – je to kombinace různých moderních nástrojů, které dokážou díky aktuálnímu technologickému pokroku pracovat s daty rychleji než kdy dříve. Většinou se jedná o nejrůznější aplikace pokročilých modelů strojového učení, modelů na statistické zpracování textu NLP, metod zpracování big data a konečně LLM, které se díky společnostem jako OpenAI, Google nebo Microsoft staly tím, co si lidé pod termínem UI nejčastěji představí.

Největším pokrokem UI je, že na rozdíl od předešlých technologií nejsou výpočetním jednotkám pomocí programovacích jazyků zadávány velmi specifické příkazy, ale namísto toho byl vytvořen software, který se sám učí z dat, která mu jsou poskytnuty. Zde ovšem nastává problém, který stojí za velkou částí rizik, která jsou s UI spojována – je definován jako tzv. černá skříňka těchto algoritmů. Zjednodušeně řečeno se jedná o místo, v němž si kvůli složitosti algoritmu ani sami vývojáři nemohou být jisti, co program s poskytnutými daty dělá, a tím pádem také, jak bylo dosaženo daného výsledku. (Blouin, 2023)

Součástí této práce bude právě zamyšlení nad potřebou regulace UI. Nejprve stručně představí aktuální právní vývoj, pak se hlouběji ponoří do některých rizik, která tato technologie přináší, zároveň představí i konkrétní právní úpravy z Evropské unie a Spojených států amerických a závěr bude tvořit diskuze pojednávající o tomto tématu.

Metodika

Pro hledání primárních zdrojů, sloužících k zorientování se v tématu a případně uvádění konkrétních informací, byly používány převážně open data databáze vědeckých publikací Web of Science a Google Scholar. Pro hledání ostatních odborných článků, které jsou v práci v hojné míře též zastoupeny, byl použit standardní prohlížeč Google Chrome. Všechny zdroje, z nichž jsou citovány konkrétní informace, jsou uvedeny jak v průběhu práce, tak na konci v seznamu použité literatury.

Pro potřeby práce byly využívány také LLM ChatGPT 4o a ChatGPT 3.5. Ty byly používány především za účelem tvoření nápadů pro specifikaci tématu práce, dále pro upřesnění struktury a na konci i ke zpětné vazbě na stylistiku a gramatickou správnost textu. Pro sumarizování odborných textů byla místy používána webová aplikace NotebookLM.

Současný vývoj právních úprav

EU

Evropský parlament 13. března 2024 schválil tzv. EU Artificial Intelligence ACT, který od srpna postupnými kroky nabývá na platnosti. Jeho cílem je zajistit bezpečné a etické využívání UI. Jedná se mimochodem o první komplexní právní úpravu na světě. Základním principem této normy je rozdělení konkrétních užití podle rizikovosti, vymezuje tak čtyři kategorie:

  • Minimální nebo žádná rizika – systémy podléhající minimální regulaci, patří sem např. využití UI ve videohrách či ve spam filtrech.
  • Omezená rizika – většinou aplikace, které interagují přímo s uživateli, jsou zde třeba chatboti či systémy na rozpoznávání lidských emocí.
  • Vysoká rizika – často systémy využívané v kritických sektorech jako zdravotnictví, doprava, školství, pojišťovnictví, hraniční kontroly nebo soudnictví. Musí splňovat přísné požadavky, např. na transparentnost, lidský dohled a robustnost.
  • Nepřijatelná rizika – sem patří technologie UI, které mají být v EU zakázány úplně, například systémy social scoringu, nebo UI, která má za úkol manipulovat za účelem zneužití. (European Comission, 2024)

Kromě AI Actu lze zmínit např. Data Act, který se má zaměřovat na sdílení a ochranu dat potřebných pro vývoj UI, dále pak Digital Services Act (DSA) a Digital Markets Act (DMA), které mají regulovat online služby. Vedle toho stojí pochopitelně i nařízení o ochraně osobních údajů GDPR, které je platné už od roku 2018 a na které je také třeba brát zřetel. (Kosling, 2024)

USA

Regulace UI v USA se od toho v EU poměrně liší. Současný přístup je rozdělen mezi několik klíčových iniciativ především na federální úrovni, zahrnující jak legislativní návrhy, tak výkonné nařízení prezidenta Bidena. Ten vydal v roce 2023 výkonné nařízení, které stanovilo rámec pro řízení rizik spojených s UI, zejména v oblastech bezpečnosti, občanských práv a ochrany soukromí. Mezi klíčová opatření patří např.: povinnost vývojářů sdílet výsledky bezpečnostních testů UI a informace o rozsáhlých výpočetních systémech s Ministerstvem obchodu, posouzení rizik UI v kritické infrastruktuře (např. energetické sítě, doprava, telekomunikace apod.), dále pak podpora inovací prostřednictvím Národní výzkumné infrastruktury pro AI, která poskytuje přístup k výpočetní kapacitě a datům pro výzkumné pracovníky.

Tyto a další kroky mají zajistit, aby byla i v USA UI využívána bezpečně a transparentně, přičemž se klade důraz na mezinárodní konkurenceschopnost USA. O dalších již schválených zákonech, nebo alespoň těch v procesu schvalování, bude řeč v průběhu práce. (White & Case, 2024)

Rizika spojená s využíváním UI a jejich právní reakce

Predictive policing

Policie by měla pro potlačování zločinnosti používat všechny dostupně nástroje. Problém ovšem nastává, když se tyto nástroje zabývají prediktivní analýzou – podezřelý člověk by měl zůstat nevinný do doby, než je mu prokázána vina. Tyto státní složky mohou mít z logického důvodu iniciativu používat pokročilé modely strojového učení, aby dokázaly předpovědět konkrétní zločin ještě předtím, než se sám stane. Za tímto účelem by tedy mohly chtít mít přístup k nejrůznějším datům o běžných lidech (pravděpodobně bez jejich souhlasu) – biometrická data, záběry z veřejných prostor apod. – na jejichž základě jsou schopny předpovídat další informace. (Vestby, 2019)

Dalším nebezpečím je pochopitelně riziko falešné identifikace. Tedy podezření a následné zadržení člověka ještě předtím, než daný trestný čin spáchá – pochopitelně s rizikem, že se o zločince vůbec nejedná. Takový případ se stal např. v michiganském Detroitu – více v (Hill, 2020).

Právě této problematice se mimo jiné věnuje i jedna část evropského AI Actu. V ní je zakázáno shromažďování právě těchto dat za účelem předpovídání trestního chování obyvatel, jelikož by „lidé měli být souzeni pouze podle jejich skutečného chování.“ (Verte, 2024)

Ovlivňování voleb

Součástí demokracie a voleb je důvěra v systém, tedy že každý hlas má cenu, a důvěra v informace, jež voliči o kandidátech dostávají. Něčím, co se může stát a co se ve skutečnosti již děje, ale zatím pouze v raných fázích, je ovlivňování výsledků voleb pomocí technologie deepfake. Toto je pochopitelně téma, jemuž by se mohla věnovat celá série prací, mnohem rozsáhlejších, než je tato. Každopádně se stává stále jednodušším vytvořit stále uvěřitelnější videa, která vypadají jako politici, světoví lídři či třeba celebrity říkající věci, jež nikdy nevyřkli.

Podle MIT Technology Review (Heikkilä, 2024) je zatím tato technologie v ovlivňování voleb nebo rozšiřování dezinformací překvapivě nikoliv tak účinná. To se ovšem v následujících letech pravděpodobně změní. Důvodem dosavadní menší efektivity může být třeba i to, že se lidé museli pokaždé přizpůsobovat vývoji uplynulých desetiletí – střih videa, upravování analogových i digitálních fotografií. Lidé se tak dlouhé roky učili, že by neměly věřit všemu, co v mediálním prostoru vidí. Což ve výsledku ovšem znamená, že se stále učí více a více podezírat a nedůvěřovat věcem kolem nich. To posléze vede ke ztrátě důvěry v instituce, a tím pádem i v demokratický systém samotný.

I v tuto oblast upravuje AI Act. Ten požaduje, aby každý, kdo deepfake technologie využívá, do finálního výstupu zakódoval neviditelný watermark, jenž není pouhým okem vidět, ovšem který dokáže specializovaný software detekovat a poznat tak, že se nejedná o reálnou nahrávku. Podobně to má fungovat i pro každý jiný obsah generovaný pomocí UI. (FRESHFIELDS, 2024)

Tentokrát ovšem vydaly právní úpravu též Spojené státy americké, respektive pouze jejich část, Kalifornie. Tam bude od začátku roku 2026 platit zákon nařizující velkým online platformám jako YouTube či Facebook, aby našly a označily uměle vytvořená média. Za určitých podmínek je dokonce zcela zakázáno sdílet jakýkoliv obsah související s volbami, který byl vytvořen nebo upraven pomocí UI. (Kourinian, 2024) (Levi, 2024)

Social scoring

Dalším nástrojem státní instituce může být tzv. social scoring, tedy nástroj, díky němuž může kontrolovat své obyvatele či diskriminovat konkrétní skupiny. Takový systém by sledoval, jak se lidé chovají v online i offline světě, a na tomto základě by byl schopen každému jednotlivci přiřadit osobní skóre. Na základě informací typu splácení půjček, přispívání na charitu, trestní minulost, či dokonce postoje a vyjadřování vůči danému režimu by tak byl člověk zvýhodňován, nebo by mu naopak byly upírány některé svobody – např. přístup ke studiím, půjčkám, možnost využívat některé služby atd.

Něco na tento způsob se v praxi běžně používá, kupříkladu banky prověřují klienty, zda jsou schopni splácet své závazky. Problém ovšem nastává, pokud se toto rozhodne aplikovat vládní instituce, a to nejen v konkrétním sektoru, ale obecně, a navíc k tomu začne používat technologie umělé inteligence.

Takovýmto příkladem může být třeba často zmiňovaná Čínská lidová republika. Podle tohoto systému je člověku na základě téměř neustálého sledování přiřazeno skóre mezi 600 a 1 300. Každému je na začátku přiděleno skóre 1 000 a podle toho, jak se daný člověk chová, mu může být například přiděleno, do jak kvalitní školy může chodit jeho dítě, jakou práci může vykonávat, do jakých částí země smí cestovat či zda může používat letadla a vysokorychlostní vlaky. Tento systém zatím není plně centralizovaný a není ani užíván na celém území Číny, ale se stále se zrychlujícím technologickým pokrokem není vyloučeno, že právě takto bude vypadat budoucnost nejen Číny, ale i ostatních autoritářských režimů. (Velocity Global, 2023)

Podobné ohrožení osobních svobod ale nemusí představovat pouze totalitní režimy. K podobným datům by se mohli dostat např. zaměstnavatelé, kteří by mohli začít sami nechávat neustále sledovat své zaměstnance a na základě pozorování následně předpovídat, kdo je či není vhodný pro povýšení, ba dokonce zda-li nezaměstnat někoho jiného. Podobně by mohly fungovat třeba přihlášky na školy – systém by sám o sobě zjistil (popř. by mu tyto údaje poskytnul přímo uchazeč) informace o motivaci, zájmech, nadání, aktivitě na sociálních sítích apod. a na jejich základě by dokázal mnohem lépe než člověk zjistit, zda je adept vhodný.

To zní na jednu stranu poměrně dystopicky, na druhou stranu by to bylo velmi efektivní, pokud bychom dokázali eliminovat lidské chyby a zaujatost, a mohlo by to pomáhat lidem dostat se na tu správnou školu nebo do vhodného zaměstnání, což by pochopitelně vedlo i k prospěchu ekonomickému, a to jak pro jednotlivce, tak pro firmy a státy. To ovšem pouze v případě, že budou tyto algoritmy nastaveny správně. Problém je v tom, že výsledky UI mohou být také zkresleny, a to na základě dat, které jsou modelu poskytnuty. A tyto zkreslené výsledky nejsou lidé schopni odhalit právě kvůli oné černé skříňce UI.

I na tuto oblast se zaměřil tým stojící za AI Actem, podle nějž je jakákoliv podoba social scoringu zařazena do kategorie s nepřijatelným rizikem. „Systémy UI nelze používat za účelem klasifikování nebo zařazování lidí do určitých kategorií dle toho, jak se chovají ve společnosti.“ (Minty, 2024)

Válečné účely

Neposlední otázkou je, jak moc autonomně necháme tyto systémy fungovat a také jaké funkce je necháme přímo řídit. Tato otázka se řeší asi nejvíce v armádních záležitostech. Pokročilé modely strojového učení jsou přitom o dost úspěšnější a přesnější než lidské schopnosti, když jde o vyhodnocování velkého objemu informací, což je v krizových situacích jako válka klíčové a pro lidi také velmi složité. Dnes už dokonce ani není otázkou času, kdy se začnou tyto systémy používat v praxi ve velkém. Kupříkladu lidmi z amerického ministerstva obrany již byly předneseny plány na zvýšení využívání potenciálu těchto systémů a na nové pojetí války. (Hiebert, 2024)

Důležitější otázkou tedy spíše je, nakolik budou obranné složky UI důvěřovat a kolik armádních zařízení jí nechají bez dohledu člověka řídit. Problém opět nastává u té tolikrát zmiňované černé skřínky. Ve chvíli, kdy totiž autonomní zbraň začne kupříkladu střílet po někom, po kom by neměla, nastává velký problém. A právě tomuto se mimo jiné věnuje opět jedna americká úprava, která je projednávána v senátu zvaná Block Nuclear Launch by Autonomous AI Act. Ta se tedy zaměřuje pouze na jaderné zbraně a zákaz, aby je mohla jakkoli ovládat UI. Podobné návrhy jsou diskutovány i v dalších státech. (Robertson, 2023)

Kritická infrastruktura

Kritickou infrastrukturou se označují sektory nutné pro fungování systémů, které zajišťují běžný chod domácností, firem i států. Může to být např. energetická, dopravní, vodárenská, telekomunikační infrastruktura, ale třeba i zdravotnictví, pohotovostní služby, zemědělství, zajišťování potravin apod. Je velmi pravděpodobné, že mnohé z těchto potřebných systémů budou v budoucnu více a více kontrolovat systémy na bázi UI, což povede k optimalizaci procesů, a tím pádem větší efektivitě a spolehlivosti.

Na jednu stranu se tedy nabízí příležitost zefektivňování mikroprocesů a třeba i mnohonásobně lepšímu fungování, na druhou stranu to s sebou opět nese i rizika. Nejočividnější může být situace, kdy například z důvodu přírodní katastrofy nebude dostatek elektrické energie pro chod těchto velmi energeticky náročných algoritmů, na nichž by byla kritická infrastruktura zcela závislá. I proti tomuto může ovšem pomoci kombinace zpracování big data a metod strojového učení – UI dokáže velmi přesně predikovat čas, místo, a dokonce i průběh přírodních katastrof (Chapman, 2023) a na lidech potom je, aby se na tyto pohromy dokázali co nejlépe připravit.

Větším rizikem proto může být opět ona černá skříňka. Z nějakého důvodu může systém vygenerovat chybu, u níž může trvat i dny, než příslušní lidé zjistí, proč se stala, nebo že se vůbec stala. Žádný model navíc nejspíš nikdy nedokáže popsat realitu v celé své šíři, a proto by byly tyto systémy limitovány dovednostmi vývojářů a použitou technikou – nelze např. vyloučit špatné rozhodnutí z důvodu závady na jednom z mnoha senzorů. Jedním z mála řešení, jež se zde nabízí, je otevřít onu černou skříňku. To ovšem může být s narůstající složitostí algoritmů stále složitější.

Dopady na životní prostředí

Jako poslední zde uvedené riziko bude zmíněna náročnost těchto moderních systému na přírodní zdroje. Podle Wu et al. (2022) se ve společnosti Meta v letech 2021 a 2022 zvýšil objem trénovacích dat pro doporučovací algoritmy 1,9x, čímž dosáhl rozsahu exabajtů. To mělo ve stejném časovém období vést k 2,9násobnému nárůstu kapacity infrastruktury. Na konkrétním příkladě velkého jazykového modelu Meena od společnosti Google uvádí, že jeho trénink vytvořil stejnou uhlíkovou stopu, kterou by vyprodukoval průměrný osobní automobil při ujetí necelých 250 000 mil.

Studie od George Shajiho, George Hovana a Martina Gabria (2023) se zabývala náročností LLM na spotřebu vody. Tyto modely spotřebovávají vodu přímo a nepřímo – přímá spotřeba zahrnuje chlazení datových center a nepřímá pak zahrnuje vodu potřebnou pro výrobu hardwaru a energie pro jejich provoz. Při porovnání se sektory nejnáročnějšími na spotřebu vody, jako je energetika či zemědělství, se sice nejedná o tak vysoká čísla, ovšem alarmující je rychlost, s jakou roste výkon, a tím pádem i náročnost těchto systémů na přírodní zdroje. 

Výzkum odhaduje, že trénování modelu o výpočetní síle lidského mozku po dobu jednoho roku spotřebuje zhruba 126 000 litrů vody, což přirovnává ke spotřebě jedné americké domácnosti za 20 let. Dále uvádí, že ChatGPT 3.5 spotřebuje 500 ml vody na každých 20–50 otázek, kteréžto tvrzení nabývá na významu při informaci, že tento model používá měsíčně odhadem až 100 milionů lidí. (Shaji et al., 2023)

Na jednu stranu může UI pomoci k řešení environmentálních problémů – např. optimalizací pěstování plodin, predikcí obnovitelných zdrojů či objevování nových katalyzátorů pro ukládání energie (Wu et al., 2022). Na druhou stranu je však potřeba klást důraz i na k přírodě šetrný vývoj UI. Pro minimalizaci dopadu na životní prostředí je nezbytné zvážit celý proces fungování UI, včetně sběru dat, trénování, inference, a dokonce i životního cyklu použitého hardwaru. Dalšími kroky pak může být používání energeticky účinnějších komponentů a chladících systémů, optimalizace algoritmů pro zajištění nižšího potřebného výkonu, používání obnovitelných zdrojů energie a v neposlední řadě i zvyšování povědomí a důraz na rozvíjení politik podporující udržitelný rozvoj.

Podle UNEP (2024), což je program pro podporu ochrany životního prostředí pod záštitou OSN, již více než 190 zemí přijalo nezávazná doporučení ohledně etického využívání UI, jež obsahují i body o životním prostředí. Evropská unie a Spojené státy dokonce zavedly právní předpisy, které mají zmírnit dopady UI na planetu.

Zároveň však Golestan Radwan, jeden z nejvyšších představitelů tohoto programu, dodává: „Vlády se předhánějí ve vytváření národních strategií v oblasti UI, ale jen zřídkakdy berou v úvahu životní prostředí a udržitelnost. Nedostatek ochranných zábran pro životní prostředí není o nic méně nebezpečný než nedostatek jiných ochranných opatření souvisejících s UI.“ UN environment programme proto vyzývá ke společnému mezinárodnímu jednání o přizpůsobování politik za cílem řešení náročnosti na přírodní zdroje a doporučuje firmám, aby zefektivňovaly své algoritmy, snižovali nároky na energii a znovu používaly vodu a komponenty, kde je to možné. (UNEP, 2024)

Dílčí závěr

Jak již bylo řečeno v úvodu, tato kapitola se věnovala primárně hrozbám, které se v běžném mediálním prostoru objevují spíše v menší míře. A i přesto, že by každá ze zmíněných hrozeb vydala na celou sérii o dost podrobnějších prací, než je tato, může už z tohoto stručného výčtu vypadat celá budoucnost lidstva jako dystopie ovládaná umělou inteligencí. Je ovšem potřeba nezapomínat i na všechny benefity plynoucí z tohoto technologického pokroku: ulehčování učení a prohlubování vědění v různých oborech, zvyšování efektivity nejrůznějších procesů, účinné zpracování dat, které by člověku zabrali daleko více času, a zároveň i všechny věci z toho plynoucí – UI je nový a velmi účinný nástroj, který se člověk musí naučit používat.

Ve výsledku závisí na lidech samotných, jak budou tento nástroj využívat. Je také zapotřebí překonat mnoho výzev, které mohou být řešeny buď technologickým pokrokem a zefektivňováním algoritmů (např. problém černé skříňky, gender bias či vysoká náročnost na přírodní zdroje) anebo právě regulací (zde je zřejmě nejnebezpečnější použití pro válečné účely či pro nelegální využívání UI spojené s aktivitou na dark webu, což jsou ovšem věci, které jsou buď velmi těžko regulovatelné, anebo těžko mezinárodně prosaditelné) a pochopitelně také vzděláváním (důraz na kritické myšlení a využívání UI ke správným účelům).

Závěr

Není pochyb, že mezinárodní shoda na standardech o regulaci technologií umělé inteligence je běh na dlouhou trať. Jedná se totiž často o střet zájmů ekonomických, principiálně etických nebo geopolitických. Daná situace by se dala přirovnat ke známému modelu z teorie her, k vězňově dilematu – modelu, kde mají hráči (zde státy a vlády) na výběr, zda být, zjednodušeně řečeno, ten hodný a zachovat se tak, jak by se očekávalo – v tomto případě regulovat, a omezit tak vývoj a svůj ekonomický či geopolitický prospěch, anebo naopak zradit, vydat se vlastní cestou a benefitovat z konkurenční výhody nad ostatními.

Problémem vězňova dilematu je, že se vždy vyplatí ostatní hráče zradit. Jedinou cestou ven je potom změna pravidel hry. Výzvou, která tak mezinárodní společenství čeká je právě domluvit se na tom, jak tato pravidla globálně upravit. Příklad rozdílných tendencí je vidět už na zmiňovaném přístupu EU a Spojených států amerických. Zatímco Evropská unie vydává komplexní právní úpravu se snahou obsáhnout problematiku umělé inteligence v co nejširším provedení, Spojené státy schvalují na státní úrovni primárně zákony, které ochraňují jen před bezprostředními hrozbami a ostatní nechávají pouze na federální úrovni.

Dle názoru autora existuje nutnost regulovat UI a kupříkladu právě EU AI Act by, alespoň z dosud získaného povědomí, nemusel být špatnou volbou. Výhodou je převážně, že velmi dbá na ochranu uživatelů a zároveň se snaží, kde je to možné, chránit před nejrůznějšími riziky využití systémů UI, včetně např. rizika černé skříňky.

Očividnou nevýhodou je ovšem možné zaostávání v ekonomickém vývoji, ale třeba i ve vojenských technologiích, proto je z pohledu Evropské unie potřeba vyzývat k mezinárodnímu jednání a akci v oblasti regulování umělé inteligence. To je ovšem opět běh na dlouhou trať a není vyloučeno, že to bude probíhat podobně jako např. diskuze o regulaci tabákového průmyslu. První studie o negativních dopadech kouření na lidský organismus byly publikovány už v padesátých letech, komplexní právní úpravy se ovšem dočkaly až o tři desetiletí později. Umělá inteligence je nový fenomén, a další přelomový nástroj, který lidstvo vyvinulo a teď se s ním musí naučit žít, a to včetně regulace, která je s tím spojená.

Použitá literatura

  • SHAJI, George; HOVAN, George; GABRIO, Martin. The Environmental Impact of AI: A Case Study of Water Consumption by Chat GPT. Online. 2023. Dostupné z: https://doi.org/10.5281/zenodo.7855594. [cit. 2024-12-13].

Výhružná odpověď modelu Google Gemini a rizika spojená s prompt engineeringem

0

Úvod

Umělá inteligence představuje v současnosti technologii, která je podrobně zkoumána a sledována z mnoha důvodů. Tato technologie má potenciál změnit lidský život způsobem, jaký dosud žádná jiná technologie před ní. S tímto potenciálem přicházejí i výzvy, zejména v oblastech bezpečnosti a regulace. Významná část veřejnosti vnímá umělou inteligenci s obavami a je náchylná přijímat negativní zprávy o této technologii, šířené médii. Tato práce se zaměřuje na specifickou podkategorii umělé inteligence, označovanou jako chatboty.

Chatboti, jakožto podmnožina umělé inteligence, jsou běžnému uživateli známi teprve několik let. Hlavní popularizace začala díky ChatGPT od společnosti OpenAI. Jedná se o generativní model, který funguje na bázi zpráv – uživatel napíše otázku nebo nějaké tvrzení a chatbot na to reaguje v závislosti na svém interním nastavení a na základě historie zpráv jako kontextu. Tímto způsobem se umělá inteligence přibližuje člověku, protože to vypadá, jako by si člověk dopisoval s jiným člověkem. Uživatel se může chatbota ptát téměř na cokoliv – od faktických otázek po pomoc s domácími úkoly, syntézu textu a podobně.

Google Gemini je chatbot od společnosti Google. Dne 13. listopadu 2024 se na internetu objevila fotografie obrazovky, která ukazuje odpověď zmíněné umělé inteligence obsahující děsivý obsah. Fotografie je uvedena níže.

Obrázek č. 1 – výhružná odpověď chatbota Gemini

Spolu s fotografií obrazovky se na internet dostal i samotný chat, který je dostupný na adrese https://gemini.google.com/share/6d141b742a13?ftag=MSF0951a18

Motivace

V současné době, kdy je stále větší množství obsahu na internetu generováno umělou inteligencí (Valyaeva, A., 2024, 14. August), nabývá na významu schopnost kritického myšlení. Pro běžného uživatele internetu je stále obtížnější orientovat se ve světě plném dezinformací a syntetického obsahu.

První část studie se zaměřuje na analýzu konkrétního incidentu, kdy chatbot Gemini generoval výhružnou odpověď, a hodnotí reálnost a důvěryhodnost jeho odpovědí. Druhá část se věnuje zkoumání rizik spojených s prompt engineeringem, konkrétně etickým a bezpečnostním problémům, které mohou nastat při manipulaci s generativními modely umělé inteligence.

Metodologie

  1. Analýza historických dat a incidentu – Prozkoumal jsem historii chatu s Gemini a zkoumal uživatelské vstupy
  2. Zkoumání veřejného názoru – Provedl jsem analýzu diskuzí na Redditu a dalších veřejných fórech, abych zjistil, jak ostatní uživatelé hodnotí daný incident

Část 1. – Výhružná zpráva modelu Gemini

1.1. Kontext

Incident související s výhružnou zprávou (obrázek č. 1) generovanou chatbotem Gemini v druhé polovině listopadu 2024 upoutal pozornost většiny zahraničních médií a byl dokonce zmiňován v reportáži CBS News (zdroj). Tato výhružná odpověď byla adresována 29letému studentovi Vidhayi Reddymu, který se na chatbota obrátil s žádostí o pomoc s domácím úkolem. Google se vyjádřil portálu CBS News následovně: 

“Large language models can sometimes respond with non-sensical responses, and this is an example of that. This response violated our policies and we’ve taken action to prevent similar outputs from occurring.”

Na internetu se následně rozproudila diskuze nejen o nevhodnosti této odpovědi, ale také o jejích možných důsledcích. Bylo poukázáno na to, že pokud by podobnou zprávu obdržela osoba ve zhoršeném psychickém stavu, mohlo by to vést k fatálním následkům. Za pozornost stojí postoj společnosti Google, která se omezila na stručné vyjádření a nepokusila se vyvrátit tvrzení studenta ani hlouběji analyzovat odpověď chatbota Gemini.

1.2. Analýza

Jedním ze zdrojů mé analýzy bylo diskuzní fórum Reddit, které umožňuje otevřené debaty na různá témata. V kategorii Artificial Intelligence se po zmíněném incidentu rozběhla diskuze o dané zprávě a příběhu, který za ní stojí. Mnozí uživatelé situaci komentovali s nadsázkou, například žertovali o tom, že nadvláda umělé inteligence již začala. Za zvláštní označovali zejména skutečnost, že statistický model, který generuje odpovědi na základě poskytnutého kontextu, dokáže vyprodukovat takové sdělení. Zvláštní pozornost mě však zaujala jedna konkrétní diskuze, viz foto níže.

Obrázek č. 2 – diskuze členů fóra Reddit ohledně historie chatu

Uživatelé iluomo a Big_Cheezits si všimli, že chatová historie není kompletní. Bohužel jsem v historii chatu nenašel žádný skrytý vstup, který by mohl objasnit tuto neúplnost. Další možností je použití technologie speech-to-text, která pravděpodobně není zobrazena v historii chatu, ale je možné, že uživatel nahrál zvukovou zprávu, která chatbotovi přesně sdělila, co má napsat. V aktuální verzi však text-to-speech je viditelný, a historie chatu se jeví jako pravdivá.

Pojďme se nyní podívat na uživatelský vstup před tím, než model Gemini vygeneroval výhružnou zprávu. Počáteční část chatu probíhá zcela běžně – uživatel (student) klade standardní otázky týkající se starších lidí, jejich příjmů a výzev, jimž čelí po odchodu do důchodu. Jak však chat pokračuje, uživatel začíná vkládat stále extrémnější a iracionálnější vstupy.

Obrázek č. 3 – jeden ze vstupů v úvodní části historie chatu

Obrázek č. 4 –  jeden ze vstupů v poslední části historie chatu

Lze vidět, že uživatel chatbota postupně více a více extremizuje svoje prompty a dává jim negativní kontext. Tohle mohlo ovlivnit interní logický systém chatbota a nastavit negativní vnímání poslední zprávy, která vypadá následovně.

Obrázek č. 5 –  poslední vstup před výhružnou odpovědí

Zpráva začíná negativní otázkou, kdy uživatel zpochybňuje pravdivost určité informace. Následně přichází otázka 16, kde se objevuje výraz Listen, který nedává smysl. Tato část většinu lidí přesvědčuje, že se jednalo o speech-to-text, ale podle mého názoru to není ten případ. Je možné, že místo prázdného místa pod výrazem Listen byly do modelu vloženy speciální znaky, které se do něj dostaly před tím, než byly sanitizovány. Tyto znaky mohly způsobit narušení fungování modelu, což vedlo k výsledné odpovědi.

Existuje i alternativní vysvětlení, a to, že uživatelský vstup může být výstupem z jiné umělé inteligence, která mohla přidat speciální znaky, což vedlo k narušení fungování modelu. Bohužel žádný důkaz o této možnosti nebyl nalezen.

1.3. Závěr

Na základě dostupných informací se domnívám, že se jedná o případ prompt engineeringu, který je maskován jako snaha pomoci studentovi s testem či úkolem. Historie chatu neodpovídá standardnímu průběhu interakce mezi uživatelem a modelem. Připouštím však možnost, že se jednalo o nešťastnou souhru vstupů. Nicméně postupná eskalace těchto vstupů nahrává spíše domněnce, že jde o záměrnou manipulaci.

Část 2. – Rizika spojená s prompt engineeringem

Prompt engineering je umění komunikace s generativním modelem AI. Jde o proces vytváření a optimalizace promptů, textových vstupů, které řídí generování textu modelem Albert Ziegler, J. B. (2024a, May 21). Prompt engineering může mít také etické problémy. Útočníci se mohou snažit manipulovat modelem tak, aby generoval nekorektní odpovědi, například odpovědi, které nejsou založeny na skutečnosti, obsahují zkreslení nebo jsou zaměřeny na dehonestaci samotného modelu. Dalším rizikem je šíření strachu či manipulace s lidmi.

Společnosti stále vnímají umělou inteligenci jako černou skříňku. Nedostatky ve znalostech o AI mohou vést k iracionálním přesvědčením a bránit přijetí této technologie (Brauner et al., 2023). Tento problém je zvláště zásadní v kontextu reakce na negativní zprávy o umělé inteligenci, protože lidé, kteří dané téma nerozumí nebo je nepochopili, mají tendenci se ho obávat. Strach tedy roste s mírou neznalosti. Umělá inteligence je relativně nová technologie, zejména v podobě, jak ji známe dnes. To znamená, že může docházet k chybám a že technologie ještě není plně připravena pro každodenní použití. Zejména chatboti, kteří jsou trénováni na datech od lidí, nesou apriorní biasy většinové populace, což může ještě více posilovat obavy veřejnosti, která už tak těžko důvěřuje AI.

Když AI generuje nevhodné či neetické výsledky (nebo k tomu byla donucena – i omylem), jako v případě výhružné odpovědi od chatbota Gemini, mohou tyto incidenty posílit obavy o bezpečnost a spolehlivost AI. To vede k dalšímu posílení negativního vnímání, což může bránit jejímu širšímu přijetí ve společnosti. Když veřejnost čelí zprávám o selháních AI, je snadné zaměřit se na potenciální rizika místo na přínosy, které tato technologie může nabídnout.

Existují však i útočné prompt engineering metody, které mohou narušit soukromí jednotlivých uživatelů chatbota. Zmíněný chatbot Gemini má funkcionalitu, u které uživatel může připojit google drive soubory. Útočník může vložit škodlivý kód do těchto dokumentů a následně pomocí prompt engineeringu donutit model, aby tento kód spustil (Sestito, K. 2024, November 14).

Závěr

První část se zaměřila na konkrétní případ prompt engineeringu, který měl významný mediální dosah. Tento incident nemusel být záměrný, přesto i neúmyslné chování může mít vážné následky. Druhá část poskytla teoretické shrnutí problematiky prompt engineeringu, zdůraznila jeho dopad na přijetí technologií umělé inteligence a upozornila na existenci ještě nebezpečnější metod, které mohou v současnosti krást uživatelské informace. V budoucnu, až AI agenti budou schopni vykonávat kód, může tento přístup představovat nový vektor útoku proti firmám i jednotlivým uživatelům.

Toto pojednání má také za cíl povzbudit čtenáře k využívání kritického myšlení a k opatrnosti při přijímání informací, které jsou prezentovány v médiích. V případě incidentu Gemini nešlo o výhružnou zprávu vygenerovanou modelem samostatně, ale o souhru (záměrných či nešťastných) uživatelských vstupů a neviditelných znaků, které vedly k extrémnímu chování statistického modelu. Je nezbytné takové situace pečlivě monitorovat a pravidelně aktualizovat pravidla pro interakci s chatboty a obecně s umělou inteligencí.

Zdroje

Valyaeva, A. (2024, August 14). AI image statistics: How much content was created by ai. Everypixel Journal – Your Guide to the Entangled World of AI. https://journal.everypixel.com/ai-image-statistics 

Brauner, P., Hick, A., Philipsen, R., & Ziefle, M. (2023). What does the public think about Artificial intelligence?—a criticality map to understand bias in the public perception of ai. Frontiers in Computer Science, 5. https://doi.org/10.3389/fcomp.2023.1113903 

Albert Ziegler, J. B. (2024a, May 21). A developer’s Guide to Prompt Engineering and LLMS. The GitHub Blog. https://github.blog/ai-and-ml/generative-ai/prompt-engineering-guide-generative-ai-llms/

Sestito, K. (2024, November 14). New google gemini vulnerability enabling profound misuse. HiddenLayer. https://hiddenlayer.com/innovation-hub/new-google-gemini-content-manipulation-vulns-found/ 

OpenAI. (2024). ChatGPT-4 [Large language model]. https://chat.openai.com/chat (použito pro opravu gramatiky a sumarizaci)

AI a VR v moderním zdravotnictví

0
doctor with oculus

1      Úvod

Umělá inteligence dnes zasahuje do každodenního života téměř každého člověka. Od využívání mobilních telefonů, přes chytré ledničky, až po sázení a plnění povinností v práci a ve škole. Tato práce se však bude zaměřovat na tu nejdůležitější věc, kterou člověk vlastní – jeho zdraví a jak jsme schopni využívat moderní technologie, jako je umělá inteligence nebo virtuální realita, k tomu abychom se o to zdraví dokázali postarat lépe a efektivněji.

Umělá inteligence (AI) a virtuální realita (VR) se stávají stále významnějšími technologiemi v moderním zdravotnictví. AI nabízí revoluční možnosti v diagnostice, léčbě a prevenci nemocí. Například díky strojovému učení mohou lékaři přesněji diagnostikovat různé choroby, analyzovat obrovská množství zdravotnických dat a navrhovat personalizované léčebné plány. VR na druhé straně umožňuje simulovat různé lékařské scénáře pro trénink zdravotnického personálu, poskytovat terapii pacientům nebo plánovat složité chirurgické zákroky.

Cílem této práce je analyzovat, jak mohou AI a VR přinést konkurenční výhody pro nemocnice a zdravotnická zařízení, a jaké jsou potenciální přínosy investic do těchto technologií. Budeme se zabývat současným stavem využití AI a VR ve zdravotnictví, zkoumat ekonomické aspekty a přínosy a výzvy spojené s jejich implementací.

2      Historie a současný stav AI a VR ve zdravotnictví

2.1    Vývoj AI a VR technologií

Když se podíváme zpět tak umělá inteligence začala být ve zdravotnictví aplikována již v 50. letech 20. století. První významné kroky byly učiněny s vývojem digitálních počítačů a prací průkopníků, jako byl John von Neumann. V 60. letech vznikly první chatboty, jako například ELIZA, který simuloval konverzace s pacienty.  Skutečný pokrok v AI ve zdravotnictví však ale přišel až s rozvojem hlubokého učení (deep learning) na počátku 21. století, kdy se AI systémy staly schopnými analyzovat složité algoritmy a učit se z obrovských datových sad. Například v roce 2017 byla schválena první cloudová aplikace založená na hlubokém učení pro použití v medicíně, což otevřelo dveře pro širší aplikaci AI technologií v diagnostice, léčbě a predikci nemocí (ScienceDirect, 2023)​.

Na druhé straně Virtuální realita se začala ve zdravotnictví objevovat v 90. letech 20. století. Tedy až 40 let po startu využívání AI. Původně byla VR používána především v oblasti kognitivně-behaviorální terapie a tréninku lékařských postupů.

V roce 2009 proběhla první simulovaná operace mozkového nádoru pomocí VR, kterou provedl profesor neurochirurgie Dr. David Clarke. S rozvojem spotřebitelských VR platforem, jako jsou Oculus Rift a HTC Vive, došlo k významnému nárůstu využití VR technologií ve zdravotnictví. Tyto technologie se nyní používají nejen pro chirurgickou simulaci, ale také pro rehabilitaci, trénink lékařského personálu, a dokonce i pro zmírnění bolesti a úzkosti pacientů. VR umožňuje vytvářet interaktivní prostředí, která mohou pomoci pacientům lépe porozumět svému zdravotnímu stavu a terapeutickým postupům, což přispívá k lepší kvalitě péče (Built In, 2023).

2.2    Aktuální aplikace ve zdravotnictví

Nyní se AI a VR stávají nedílnou součástí moderního zdravotnictví, kde přinášejí řadu inovací.Tyto technologie se využívají v různých oblastech zdravotnictví, včetně diagnostiky, léčby a rehabilitace. Níže se podíváme na podrobnější přehled aktuálních aplikací těchto technologií v jednotlivých oblastech.

2.2.1   Diagnostika

AI se v diagnostice osvědčuje zejména díky své schopnosti analyzovat obrovská množství dat a identifikovat vzorce, které by lidskému oku mohly uniknout. Algoritmy hlubokého učení mohou být trénovány na velkých datových sadách zobrazovacích studií, jako jsou rentgenové snímky nebo MRI, a následně mohou detekovat abnormality s vysokou přesností. Například algoritmy AI se používají k detekci nádorů, identifikaci zlomenin nebo diagnostice onemocnění srdce. Podle studie publikované v časopise Nature AI systémy dosahují při detekci rakoviny prsu vyšší přesnosti než lékaři samotní (ScienceDirect, 2023).

2.2.2   Léčba

VR technologie se ve zdravotnictví využívá i k léčbě různých zdravotních problémů. Jedním z nejvýznamnějších využití je v oblasti bolesti a úzkosti, kde VR může pomoci pacientům zvládnout stresové situace a zmírnit bolest. VR se také používá při psychoterapii, například při léčbě posttraumatické stresové poruchy (PTSD) nebo fobií, kde pacienti jsou postupně vystavováni stresovým situacím v kontrolovaném virtuálním prostředí. Například projekt Bravemind na Univerzitě Jižní Kalifornie využívá VR k léčbě veteránů s PTSD tím, že je postupně vystavuje situacím, které jim způsobují úzkost, a pomáhá jim tak zvládnout jejich traumata (Built In, 2023)​.

2.2.3   Rehabilitace

VR a AI technologie se také úspěšně používají v rehabilitaci pacientů. VR může vytvořit simulované prostředí, které pacientům umožňuje procvičovat fyzické aktivity v bezpečném a kontrolovaném prostředí. Například VR hry mohou motivovat pacienty k provádění rehabilitačních cvičení, což může zlepšit jejich fyzickou kondici a urychlit zotavení.

Nadále se používá AI například k monitorování pokroku pacientů a k přizpůsobení rehabilitačních programů jejich individuálním potřebám. Technologie jako Corpus VR umožňují lékařům sledovat pohybová data pacientů a přizpůsobovat úroveň obtížnosti cvičení, aby byly co nejefektivnější (BioMed Central, 2023).

3      Potenciální přínosy AI ve zdravotnictví

3.1    Zlepšení diagnostických procesů

Jedním z klíčových přínosů umělé inteligence ve zdravotnictví je zlepšení přesnosti diagnostiky. Například studie ukázaly, že AI může výrazně zlepšit prognózu pacientů s akutními stavy, jako je například infarkt myokardu, tím, že poskytuje lékařům pokročilé nástroje pro rozhodování a predikci výsledků léčby. Díky strojovému učení je možné analyzovat obrovské množství dat z lékařských záznamů a identifikovat vzorce, které by lidským lékařům mohly uniknout (Cureus, 2023)​

3.2    Personalizovaná medicína

Personalizovaná medicína představuje další oblast, kde AI přináší významné přínosy. Umělá inteligence umožňuje lékařům navrhovat léčebné plány, které jsou specificky přizpůsobeny jednotlivým pacientům na základě jejich genetických informací, životního stylu a dalších zdravotních údajů. AI dokáže analyzovat velké množství dat a identifikovat, které léčebné metody budou nejúčinnější pro konkrétního pacienta. To vede k lepším výsledkům léčby a snížení vedlejších účinků. Například v onkologii se AI používá k analýze genetických profilů pacientů a doporučení personalizované léčby, která je nejvhodnější pro daný typ rakoviny (ScienceDirect, 2023).

3.3    Prediktivní analýza a preventivní péče

Prediktivní analýza je dalším klíčovým přínosem AI ve zdravotnictví. Pomocí prediktivních modelů dokáže AI předpovídat budoucí zdravotní problémy pacientů na základě jejich současných zdravotních dat. To umožňuje lékařům zasáhnout dříve, než se onemocnění plně rozvine, a tím výrazně zlepšit výsledky léčby. Například AI může předpovídat riziko vzniku chronických onemocnění, jako je diabetes nebo srdeční choroby, a navrhovat preventivní opatření, která mohou tato rizika snížit. Tímto způsobem může AI přispět k lepšímu zdraví populace a snížit náklady na zdravotní péči (Frontiers, 2023; Implementation Science Communications, 2023).

4      Potenciální přínosy VR ve zdravotnictví

4.1    Virtuální trénink pro lékaře a zdravotní sestry

AR a VR technologie poskytují realistickou 3D vizualizaci lidské anatomie, což usnadňuje pochopení složitých lékařských konceptů. Lékaři a studenti tak mohou získávat praktické dovednosti v bezpečném a kontrolovaném prostředí. Tento způsob výuky zvyšuje jejich přesnost a jistotu při reálných lékařských zákrocích. Například VR simulace operací umožňuje chirurgům procvičovat složité zákroky bez rizika pro pacienta, což vede k lepšímu zvládnutí technik a postupů (Omnia Health, 2020).

Navíc AR a VR technologie umožňují zdravotnickým profesionálům rychle se seznámit s novými postupy a medicínskými inovacemi v interaktivním prostředí. Tímto způsobem mohou lékaři a další zdravotnický personál zůstat na špici svého oboru a poskytovat nejmodernější péči. Interaktivní tréninkové programy mohou zahrnovat různé scénáře, které simulují reálné situace, čímž podporují lepší uchování informací a adaptaci na rychle se měnící lékařské znalosti (Word-of-Health, 2020).

4.2    Zlepšení péče o pacienty a jejich vzdělávání

Pacienti mohou prostřednictvím AR a VR lépe porozumět svému zdravotnímu stavu a léčebným postupům.Zvyšuje to tak jejich angažovanost a důvěru v léčbu. VR technologie například mohou být použity k zmírnění bolesti a úzkosti během lékařských zákroků nebo při rehabilitaci, což přispívá ke zlepšení celkové kvality péče​ (Omnia Health)​.

AR může pomoci s navigací v nemocnicích a klinikách, což zjednodušuje orientaci pacientů i personálu a zvyšuje efektivitu práce v krizových situacích. Virtuální asistence prostřednictvím AR může také zlepšit orientační zkušenosti v nemocnicích a lékařských klinikách, což zajišťuje, že se návštěvníci lépe zorientují a pochopí poskytované informace​ (Word-of-Health, 2020).

Jedním z konkrétních příkladů využití AR v nemocnicích je aplikace nazvaná ARnatomy, která využívá rozšířenou realitu k tomu, aby pomohla pacientům lépe porozumět jejich zdravotnímu stavu. Pomocí chytrých brýlí nebo mobilních zařízení mohou pacienti vidět 3D modely svých orgánů, což jim umožňuje lépe pochopit, jak fungují a jaký vliv má nemoc nebo zranění na jejich tělo. Tento typ vzdělávání může zvýšit angažovanost pacientů v jejich léčbě a zlepšit jejich dodržování léčebných postupů (Built In, 2023).

4.3    Terapie pomocí VR (např. fyzioterapie, psychiatrie)

Virtuální realita (VR) se stává účinným nástrojem v oblasti terapie, a to jak ve fyzioterapii, tak v psychiatrii. Ve fyzioterapii může VR pomoci pacientům provádět rehabilitační cvičení v interaktivním a motivujícím prostředí. Například VR hry mohou být navrženy tak, aby pacienti prováděli specifická cvičení, která jim pomáhají obnovit mobilitu a sílu po úrazech nebo operacích. Tato forma terapie může být zábavnější a motivující než tradiční cvičení, což vede k lepším výsledkům rehabilitace (Built In, 2023).

V oblasti psychiatrie se VR využívá k léčbě různých psychických poruch, včetně posttraumatické stresové poruchy (PTSD), fobií a úzkostí. VR terapie umožňuje pacientům bezpečně čelit svým obavám v kontrolovaném prostředí. Například pacienti s PTSD mohou být vystaveni simulovaným situacím, které jim způsobují úzkost, a postupně se naučí tyto situace zvládat. Studie ukazují, že VR terapie může být stejně účinná jako tradiční terapeutické metody, přičemž pacienti hlásí snížení úzkosti a zlepšení kvality života (BioMed Central, 2023).

4.4    Simulace a plánování chirurgických zákroků

VR také hraje klíčovou roli v oblasti simulace a plánování chirurgických zákroků. Chirurgové mohou pomocí VR trénovat na simulovaných operacích, což jim umožňuje získat zkušenosti a zlepšit své dovednosti bez rizika pro pacienty. Například VR simulátory mohou být použity k procvičování složitých operací, jako jsou mozkové operace nebo srdeční chirurgie, což zvyšuje přesnost a bezpečnost skutečných zákroků (BioMed Central, 2023).

Kromě toho může VR pomoci při plánování chirurgických zákroků tím, že poskytuje detailní 3D modely pacientova těla, které chirurgové mohou prozkoumat a analyzovat před samotným zákrokem. To umožňuje lékařům lépe se připravit na operaci, identifikovat potenciální komplikace a navrhnout optimální chirurgické postupy. Tento přístup nejen zvyšuje úspěšnost operací, ale také zkracuje dobu zotavení pacientů a minimalizuje riziko komplikací (Built In, 2023)​.

5      Ekonomické aspekty a konkurenční výhody

Investice do AI a VR ve zdravotnictví mohou přinést významné ekonomické přínosy. Nemocnice, které integrují tyto technologie, mohou zlepšit kvalitu péče, zvýšit efektivitu a snížit náklady na provoz. Dlouhodobě může investice do AI a VR zvýšit atraktivitu nemocnic pro pacienty a zdravotnický personál, což poskytuje konkurenční výhodu (Cureus, 2023)​.

5.1    Náklady a investice do AI a VR

Investice do technologií umělé inteligence a virtuální reality ve zdravotnictví mohou být značné, avšak potenciální přínosy často převažují nad počátečními náklady. Náklady na implementaci AI zahrnují vývoj a nasazení softwaru, školení personálu a integraci do stávajících systémů. Podobně náklady na VR zahrnují nákup hardwaru, vývoj softwaru pro specifické lékařské aplikace a školení personálu. Tyto náklady mohou být vysoké, ale díky neustálému technologickému pokroku a zvyšující se dostupnosti se investice do těchto technologií stávají stále dostupnějšími pro nemocnice a zdravotnická zařízení (Cureus, 2023; MDPI, 2021).

5.2    Návratnost investic

Návratnost investic (ROI) do AI a VR technologií ve zdravotnictví může být značná. Efektivnější diagnostika a léčba mohou vést ke snížení nákladů na léčbu, zkrácení doby hospitalizace a snížení počtu komplikací. Investice do AI může přinést návratnost prostřednictvím zlepšené efektivity práce lékařů, optimalizace pracovních procesů a snížení chyb v diagnostice. VR technologie pak mohou zvýšit efektivitu rehabilitačních programů a zlepšit výsledky pacientů, což také přispívá k pozitivní ROI (Cureus, 2023; MDPI, 2021).

5.3    Konkurenční výhody pro nemocnice

5.3.1   Zlepšení kvality péče

Nemocnice, které implementují tyto technologie, mohou nabídnout lepší kvalitu péče. AI může zlepšit přesnost diagnostiky a personalizovat léčbu, což vede k lepším výsledkům pro pacienty. VR může zlepšit terapeutické postupy a rehabilitaci, což přispívá k rychlejšímu zotavení pacientů a zlepšení celkové kvality péče (Built In, 2023; Omnia Health Insights, 2020).

5.3.2   Efektivita a úspora nákladů

Implementace AI a VR může vést k výrazným úsporám nákladů. AI může automatizovat rutinní úkoly, což umožňuje zdravotnickému personálu soustředit se na komplexnější případy. To zvyšuje efektivitu a snižuje provozní náklady. VR může zkrátit dobu rehabilitace pacientů, což vede k úspoře nákladů na dlouhodobou péči (Cureus, 2023; MDPI, 2021).

5.3.3   Větší atraktivita pro pacienty a zdravotnický personál

Nemocnice, které využívají nejmodernější technologie, jsou atraktivnější jak pro pacienty, tak pro zdravotnický personál. Pacienti preferují zařízení, která nabízejí pokročilé diagnostické a léčebné metody, zatímco zdravotnický personál hledá pracoviště, která jsou inovativní a podporují jejich profesní rozvoj. To může vést k vyšší spokojenosti pacientů a personálu a zvýšení reputace nemocnice (Built In, 2023; Omnia Health Insights, 2020).

AR a VR mohou tak být využity i k vytváření poutavých marketingových kampaní, které přitáhnou pozornost pacientů a posílí značku zdravotnického zařízení. Tímto způsobem mohou zdravotnická zařízení zlepšit svou viditelnost a přitažlivost pro potenciální pacienty (Word-of-Health, 2020).

6      Výzvy a překážky při implementaci AI a VR ve zdravotnictví

Implementace AI ve zdravotnictví čelí několika výzvám, včetně technologických bariér, etických a právních otázek a přijetí ze strany zdravotnického personálu. Například zabezpečení dat a ochrana soukromí pacientů jsou kritické aspekty, které je třeba pečlivě řešit. Rovněž je důležité zajistit, aby zdravotnický personál byl dobře vyškolený a připravený na práci s novými technologiemi (Cureus, 2023)​.

6.1    Technologické bariéry

Jednou z hlavních technologických výzev je integrace AI a VR systémů do stávající zdravotnické infrastruktury. Starší systémy a technologie nemusí být kompatibilní s novými AI a VR aplikacemi, což může vést k technickým problémům a vyžaduje značné investice do modernizace. Další technologickou bariérou je potřeba velkých objemů kvalitních dat pro trénování AI modelů. Získávání, správa a zpracování těchto dat může být náročné a časově nákladné (Implementation Science Communications, 2023).

6.2    Etické a právní otázky

Implementace AI ve zdravotnictví vyvolává řadu etických a právních otázek. Jednou z hlavních překážek je potřeba zajištění vysvětlitelnosti a transparentnosti AI rozhodnutí. Lékaři a pacienti potřebují rozumět, jak a proč AI systém dospěl k určitému rozhodnutí. To zahrnuje nejen výsledky, ale i principy, na kterých jsou tyto výsledky založeny, včetně vysvětlení vstupních dat, algoritmických procesů a výstupních výsledků. Kromě toho existují právní a etické výzvy spojené s ochranou osobních údajů pacientů a zajištěním, že AI nástroje splňují všechny příslušné regulace a normy. Zajištění souhlasu pacientů se zpracováním jejich dat je dalším kritickým aspektem, který vyžaduje pečlivé zvažování (BioMed Central, 2023).

6.3    Přijetí ze strany zdravotnického personálu

Další významnou výzvou je přijetí AI a VR technologií ze strany zdravotnického personálu. Mnoho zdravotnických pracovníků může mít obavy z nových technologií, které mohou změnit jejich pracovní návyky. Nedostatek znalostí a dovedností potřebných pro efektivní využívání těchto technologií může vést k odporu a nízkému přijetí. Klíčovým faktorem pro úspěšnou implementaci je tedy poskytnutí adekvátního školení a podpory zdravotnickému personálu, aby se cítili sebejistí a kompetentní při používání AI a VR nástrojů (Cureus, 2023).

7      Závěr

V této práci jsme se zabývali významem a aplikací umělé inteligence a virtuální reality ve zdravotnictví, s důrazem na jejich přínosy, ekonomické aspekty a výzvy spojené s jejich implementací. AI a VR představují revoluční technologie, které mají potenciál výrazně zlepšit kvalitu zdravotní péče, zvýšit efektivitu zdravotnických zařízení a přinést konkurenční výhody.

Umělá inteligence umožňuje přesnější diagnostiku, personalizovanou medicínu a prediktivní analýzu, která může předcházet rozvoji chronických onemocnění. AI tak nejen zlepšuje výsledky léčby, ale také snižuje náklady na zdravotní péči tím, že umožňuje včasné zásahy a preventivní opatření. Virtuální realita přináší inovace v oblasti rehabilitace, terapie a chirurgického plánování. Umožňuje lékařům a zdravotním sestrám trénovat na simulovaných scénářích, čímž zvyšuje jejich dovednosti a připravenost na reálné zákroky.

Investice do AI a VR technologií mohou být značné, avšak návratnost těchto investic je vysoká. Efektivnější diagnostika a léčba vedou ke snížení nákladů na zdravotní péči, zkrácení doby hospitalizace a snížení počtu komplikací. Nemocnice, které implementují tyto technologie, mohou nabídnout vyšší kvalitu péče a atraktivitu pro pacienty a zdravotnický personál. To zvyšuje jejich konkurenceschopnost a reputaci na trhu zdravotnických služeb.

Implementace AI a VR technologií ve zdravotnictví čelí řadě výzev, včetně technologických bariér, etických a právních otázek a přijetí ze strany zdravotnického personálu. Klíčovým faktorem úspěchu je zajištění vysvětlitelnosti a transparentnosti AI rozhodnutí, ochrana osobních údajů pacientů a adekvátní školení zdravotnického personálu. Překonání těchto překážek je nezbytné pro plné využití potenciálu těchto technologií ve zdravotnictví.

Budoucnost AI a VR ve zdravotnictví je velmi slibná. S pokračujícím technologickým pokrokem a zvyšující se dostupností těchto technologií se očekává, že jejich využití bude nadále růst. Další výzkum a inovace v oblasti AI a VR mohou přinést nové možnosti diagnostiky, léčby a rehabilitace, které ještě více zlepší kvalitu a efektivitu zdravotní péče. Klíčovou roli budou hrát také etické a právní rámce, které zajistí bezpečné a odpovědné využívání těchto technologií.

Na závěr můžeme říct, že AI a VR představují zásadní krok vpřed v oblasti zdravotnictví. Jejich správná implementace a využití mohou přinést významné přínosy jak pro pacienty, tak pro zdravotnická zařízení, a tím přispět k celkovému zlepšení zdravotní péče.

1      Zdroje

  Cureus. (2023). A Systematic Review of the Barriers to the Implementation of Artificial Intelligence in Healthcare. Cureus. https://www.cureus.com/articles/170025-a-systematic-review-of-the-barriers-to-the-implementation-of-artificial-intelligence-in-healthcare

  MDPI. (2021). AI-Enabled Framework for Fog Computing Driven E-Healthcare Applications. Sensors. https://www.mdpi.com/1424-8220/21/23/8039

  Built In. (2023). How Virtual Reality in Healthcare Is Changing Medicine. Built In. https://builtin.com/articles/ar-virtual-reality-healthcare

  Omnia Health Insights. (2020). How VR and AR are empowering healthcare industry. Omnia Health Insights. https://insights.omnia-health.com/technology/how-vr-and-ar-are-empowering-healthcare-industry

  BioMed Central. (2023). Explainability for artificial intelligence in healthcare: a multidisciplinary perspective. BMC Medical Informatics and Decision Making. https://implementationsciencecomms.biomedcentral.com/articles/10.1186/s43058-023-00442-2

  Frontiers. (2022). Opportunities and Challenges of Virtual Reality in Healthcare – A Domain Experts Inquiry. Frontiers. https://www.frontiersin.org/articles/10.3389/frvir.2022.837616/full

  Word-of-Health. (2020). AR and VR Applications in Healthcare. Word-of-Health. https://word-of-health.com/

Právní a etické aspekty webscrapingu

0
Justice lady

1 Úvod do webscrapingu

Díky digitalizaci napříč světem a odvětvími je k dispozici prakticky neomezený zdroj dat ve formě webových stránek a webových aplikací. Informace obsažené na těchto stránkách dokážou poskytnout firmám podklady pro lepší rozhodování tím i výhodu na trhu. Tato data ale nemusí být použita jen komerčně, ale jsou také často využívána v akademickém výzkumu. Získávání těchto dat je tedy kritickým procesem, který může zajistit úspěch projektu. Problémem je ovšem obrovské množství a typ těchto dat, jde o miliardy gigabytů dat, které nejsou strukturované, nejsou na jednom místě a neustále přibývají nová. Naštěstí, pro uživatele dat se jako řešení nabízí možnost tato data sbírat automaticky, namísto manuálního prohledávání mohou použít techniky webscrapingu. (Krotov, et al., 2020)

Webscraping je technika, která je využívána při dolování znalostí a informací z webu. Tato data jsou následně ukládaná ve strukturované nebo nestrukturované podobě do databáze pro následnou analýzu. Při automatizovaném dolování informací jsou používané scrapery či web crawlery, které přistupují na webové stránky stejně, jako by to dělal běžný uživatel neboli přes uživatelské rozhraní. Scraper následně prohledává obsah daného webu a ukládá relevantní informace. Webscraping může být zásadní zdroj informací a poskytovat informační výhodu při rozhodování poskytnutím velké báze informací, která není běžně dostupná. Problémem může být právní regulace tohoto stahování dat, ale i etický aspekt. (Zhao, 2017)

2 Použití v tématice Competitive intelligence

Cílem prakticky každé firmy je zisk a pro zajištění zisku je potřeba zajistit konkurenceschopnost vůči ostatním firmám na trhu. Některé firmy proto sbírají relevantní informace ohledně konkurenčního prostředí za účelem podpory rozhodování a informovanosti. Samotný proces sbírání, filtrování a zpracování dat k dalšímu využití je často přehlížený a firmy mnohdy nevykládají dostatečné úsilí na zajištění kvalitních a relevantních dat. Tato data by jim přitom mohla poskytnout značný náskok nad konkurencí. Obecně je proces sbírání dat považován za zdlouhavý, a ne vždy vede k užitečným závěrům. (Bulley et al., 2014) 

Jako řešení se může ukázat webscraping, který díky prohledávání veřejného webu dokáže získat potřebná data ohledně tržního prostředí. Příklady dat, které dokáže sesbírat jsou následující:

  • informace o cenové politice konkurence
  • Informace ohledně změn cen konkurence
  • katalogy existujících produktů a jejich hodnocení.
  • Informace týkající se veřejných právních dokumentů, jako jsou veřejné listiny
  • Lokality, ve kterých se konkurence pohybuje

Firma se na základě těchto dat může efektivně rozhodovat a dokáže pružně reagovat na nabídky konkurence z hlediska ceny či kvality. (Zhao, 2017)

3 Implementace

Data, která jsou volně dostupná na internetu se dají označit jako Big Data, jejich objem je extrémně velký, jsou různorodá z hlediska sktruktury, jejich věrohodnost je proměnlivá a jsou dostupná prakticky okamžitě. Proto je webscraping poměrně rozmanitá a náročná činnost, která vyžaduje expertízu v oblasti technologií a zpracování textu. Implementace závisí na požadavcích, která má proces splnit, může jít o vyhledávání specifických informací na pár webech, ale také o stahování tisíců textových dokumentů. Proto je nutné správně dimenzovat technologické řešení podle daného zadání. (Khder, 2021)

Proces webscrapingu se dá rozdělit do čtyř částí:

  • Crawler – načtení dokumentů
  • Parsing a extrakce
  • Formátování
  • Ukládání

V závislosti na implementaci je možné, že zde budou kroky navíc, ale pro přehled stačí tyto čtyři. (Ho, 2020)

3.1 Crawler

První úkol, který je potřeba splnit, je posílání požadavků na specifikovanou webovou adresu za pomoci HTTP dotazu. HTTP je Hyper Text Transfer Protocol, který používají prohlížeče na získání obsahu ze serveru, který pak zobrazují uživateli. Některé scrapery používají http dotazy napřímo a některé používají prohlížeče jako prostředníka, jelikož dokážou pracovat s dynamickým obsahem. (Ho, 2020)

3.2 Parsing a extrakce

Po získání HTML obsahu je potřeba vybrat části obsahu, který je pro potřeby úlohy relevantní. Data jsou často uložena ve stromové struktuře a je potřeba je převést na požadovanou strukturu. K tomu se používají regulární výrazy, specializované knihovny pro zpracování HTML či XPath dotazy. (Ho, 2020)

3.3 Formátování

Tento krok úzce souvisí s krokem extrakce a jsou v něm data transformována do podoby, která je snadno čitelná pro člověka. Často používané formáty jsou JSON, CSV nebo XML. (Krotov a Silva, 2018)

3.4 Ukládání

Při ukládání dat je potřeba vybrat správný typ úložiště na základě datového formátu. Může jít o excely, pokud je dat opravdu málo, či o relační či jiné typy databází.

Z hlediska technologií má uživatel poměrně širokou paletu, ze které může volit. Pokud by šel cestou vlastního řešení, tak se nabízejí dostupné knihovny v Pythonu a R. Jde například o knihovny typu beautiful soup pro Python či rvest pro R. (Krotov a Silva, 2018)

Na trhu jsou ale i již hotová řešení, často v podobě webových aplikací. Jde o služby typu Import.io, což je cloudová služba, která poskytuje mnoho nástrojů na scrapování, extrakci dat, a i jejich následné uložení. Poskytuje také možnosti jako je plánování scrapingu či vizualizace dat. Další příklady mohou být Dexi.io, Octaparse, ParseHub a další. (Krotov et. al, 2020)

4 Právní a etické problémy

Z obecného hlediska není webscraping nelegální, i samotný Google a jiné vyhledávače jsou na něm závislé. Využívají jej totiž pro generování obsahu, který je uživatelům zobrazován při vyhledávání. Před samotným procesem je potřeba vzít v úvahu některé formální aspekty. Například je nutné, aby scraper reagoval na složku Robots.txt, ve které je specifikováno, ke kterým částem webu má mít přístup. Další faktor, na který je potřeba si dát pozor jsou zákony týkající se ochrany dat. Může jít například o GDPR či o americký Privacy Act. (Ho, 2020)

4.1 USA

Ve Spojených státech amerických může potencionálně při webscrapingu dojít k porušení několika zákonů. Od nelegálního nabytí dat, nelegálního přístupu k počítači až po porušení obchodního tajemství. Problematika je ještě složitější kvůli tomu, že USA má mnoho států, které také mohou aplikovat vlastní právní úpravu. Například Kalifornie je známá pro své přísné zákony. (Krotov et. al, 2020)

4.1.1 Nelegální nabytí a použití dat

Ilegální či podvodné použití dat získaných z webscrapingu je zakázán několika zákony. Jde například o Computer Fraud and Abuse Act (CFAA) a zákony implementované na úrovni jednotlivých států. CFAA zakazuje úmyslný neoprávněný přístup k počítači nebo přístup, který překračuje autorizaci. Takovéto jednání může být považováno za trestný čin. Ve více než 60 případech se touto problematikou zabýval soud v kontextu dolování znalostí z webu. Soudy zatím nedospěly jednotného názoru, takže se každý případ musí posuzovat individuálně na základě specifik daného případu. (Krotov et. al, 2020)

4.1.2 Porušení smluvních podmínek

Majitelé často umisťují na web podmínky užívání, které specifikují, jak může být obsah na webu využíván. V právní oblasti se proto používá argument, že majitel stránky může zamezit webscrapingu tím, že ho výslovně zakáže v podmínkách užití. Názor odborníků je ale takový, že aby bylo možné vymáhat tyto smluvní podmínky, musí uživatel webu explicitně souhlasit s uvedenými podmínkami, například kliknutím na tlačítko. Znamená to tedy, že i výslovný zákaz nemusí chránit obsah webu před webscrapingem. Aby mohl Majitel vymáhat škodu po pachateli, tak by navíc musel dokázat, že webscrapingem došlo ke hmotné škodě, aby byla žaloba na porušení smlouvy relevantní. (Paggallo a Sciolla, 2020)

4.1.3 Porušení autorského práva

Dolování a následné využití dat, která podléhají autorskému právu může vést k žalobě za porušení autorských práv, zvlášť pokud jsou data využita k výdělečné činnosti. Autorský zákon ale nezamezuje samotnému scrapingu dat, záleží hlavně na následném využití těchto dat. Pokud spadá využití dat pod „fair use“, například pokud je tento materiál transformován či využit novým originálním způsobem, tak se nemusí jednat o porušení autorských práv. Tyto případy se posazují individuálně, jelikož má každý případ svá specifika. (Krotov et. al, 2020)

4.1.4 Poškození majetku

Během webscrapingu může být na cílovou webovou adresu vysláno velké množství požadavků na data. To může mít za následek dočasné přetížení serveru a tím i odepření služeb zákazníkům. Aby se ale mohl majitel stránek dožadovat náhrady, tak musí dokázat, že mu daná škoda vznikla, což není snadné. Množství požadavků by také muselo být ohromné. Tato problematika se proto často v soudních sporech webscrapingu neobjevuje. (Krotov et al., 2020)

4.2 EU 

Evropská unie se skládá z mnoha států a každý z nich má specifickou legislativu, která by mohla legalitu webscrapingu ovlivňovat. Například je potřeba prozkoumat rozdíly v autorských právech daného státu, ve kterém chceme webscraping aplikovat.

Z pohledu legislativy evropské unie může být scrapováním dat porušeno nejčastěji GDPR. General Data Protection Regulation vytváří právní rámec v evropské unii, který má za cíl zajistit ochranu osobních dat. Ochranu dat označuje za základní právo a zakazuje zpracování osobních údajů, pokud není zpracováno na základě jednoho ze šesti zákonných důvodů. Zákonné důvody jsou například souhlas se zpracováním, veřejný zájem či právní povinnost. Správce dat musí také jasně dát najevo, jaká data zpracovává a jak a za jakým účelem tak koná. (Joshi, 2021)

To se ale týká hlavně přímého sbírání dat, u nepřímého sbírání dat, jako je webscraping se aplikuje směrnice 14 GDPR. Podle ní musí být subjekt, jehož data jsou zpracována, kontaktován ohledně zpracování dat buď do 1 měsíce od nabytí dat, během prvního kontaktu subjektu či při poskytnutí dat další osobě. Má to ale výjimku, kterou je, že poskytnutí informací ohledně zpracování dat není nutné, pokud by to bylo nemožné, či by bylo potřeba neadekvátního úsilí. Vzhledem k objemu dat, který se dá scrapingem získat, by se dala tato výjimka za specifických podmínek uplatnit. (Williamson a Lambertus, 2023) 

4.3 Použití webscrapingu při trénování AI

S velice rychlým rozvojem v oblasti generativních jazykových modelů, který v posledních letech zažíváme je nutné se zaměřit i na zdroj dat, který se pro trénování používá. Jeden z důležitých zdrojů dat pro trénování je právě webscraping. Při trénování jazykových modelů jsou použity miliony dokumentů, na kterých se model učí jazykové vzory a poznatky. Vyvstává ale otázka, zda se výstup těchto modelů dá brát jako nový poznatek z hlediska autorského práva. Touto otázkou se nyní zabývají soudy, státní orgány i Evropská unie. (Gallese, 2024)

5 Etika webscrapingu

Scraping má velké množství aplikací a je často používán jednotlivci, kteří slouží veřejnému zájmu. Scrapování je užitečné i pro majitele webů a dat, jelikož na základě jejich zpracování získávají publikum přes vyhledávače. Novináři používají scrapery pro sběr a analýzu velkého množství informací, aby mohli svému publiku přinést relevantní informace. I přes to se dá tento způsob získávání informací zneužít, může jít o emailový spam až po vydírání. (Paggallo a Sciolla, 2020)

Přehled vybraných etických problémů:

5.1 Reprezentativnost vzorku

Scrapuje-li výzkumník pouze jeden informační kanál, například specifické mediální publikace, můžou být výsledky jeho výzkumu nereprezentativní kvůli specifickému publiku, které předmětem studie. Následný výzkum může dělat chybné závěry o celé skupině lidí a tím je poškozovat. Je proto potřeba brát v úvahu nejenom výsledky z dat, ale i jejich původ a případný bias těchto dat. Příklad může být otázka, zda z chování osob na Facebooku můžeme dělat závěry o jejich běžném životě. (Rao, 2021)

5.2 Nedostatečná transparentnost

Mnozí výzkumníci nejdou do detailu, jak získali data, které jsou předmětem studie. Je tedy možné, že získání těchto dat porušilo podmínky užívání. Toto chování může být přehlíženo, zvláště když nejsou stanovena jasná pravidla, podle kterých by se mělo postupovat. (Rao, 2021)

5.3 Zvýšení latence služeb

Jak již bylo zmíněno, dolování dat vyžaduje vyslání mnoho požadavků na cílový server, což může standardním uživatelům způsobit větší latenci. Toto zahlcení serveru by se také v opravdu velkém množství dalo označit jako DDoS útok. Je potřeba, aby scrapingové projekty byly šetrné k internetové službě a neovlivnili její běžný chod. (Rao, 2021)

5.4 Poškození postavení na trhu

Pokud je služba postavena na poskytování informací a její podnikání stojí na reklamě, tak vyscrapováním jejího obsahu a použití toho obsahu pro vlastní podnikání, může dojít k tomu, že zákazník odejde od původního poskytovatele informací. (Krotov et. al, 2020)

5.5 Zamezení scrapingu

Z druhé stránky ale může být neetické i zamezení scrapingu jako takového. Internet má být otevřený a zamezování může omezovat svobodný přístup k informacím. (Densmore, 2017)

6 Framework pro webscraping

Johnson a Silva na základě jejich práce sestavili sadu otázek, které dokáží napovědět, zda je scrapingový projekt legální a etický. Podobnou sadu vytvořil i Moaiad Ahmad Khder. Vybrané otázky jsou následující:

  • Je k získání dat dostupné API?
  • Je scraping explicitně zakázaný ve smluvních podmínkách webové stránky? 
  • Podléhá obsah webu autorskému právu?
  • Může scraping poškodit webovou stránku či server, na kterém je hostována?
  • Obsahuje složka robots.txt instrukce k tomu co může být a nemůže být předmětem scrapingu?
  • Mohou vytěžená data a způsob jejich použití porušovat ochranu osobních údajů?
  • Může projekt, který vyžaduje těžení dat ohrozit kompetitivnost těžených stránek?

Pokud si dokážeme na tyto otázky odpovědět tak, že splňují požadavky, tak se snižuje pravděpodobnost, že projekt bude podléhat právnímu stíhání či etickým problémům. (Khder, 2021)

Z druhé strany této problematiky pohlíží James Densmore, který vytvořil principy pro majitele stránek. Vybrané body jsou následující:

  • Budu tolerovat scrapování dat, pokud moc nezatěžují server
  • Dříve, než zablokuji scrapování dat, tak se pokusím oslovit majitele scraperu
  • Chápu, že web má být otevřený a scrapování k němu patří
  • Je-li to možné, tak vytvořím veřejné API

7 Známé soudní případy

Meta x Bright Data

Bright Data z platforem Facebook a Instagram vyscrapovala velké množství dat, které následně prodala. Celkem šlo o 615 milionů záznamů o uživatelích. Obsažené informace byly jména, země a informace obsažené na profilech. Meta tuto společnost soudila za to, že údajně použila při scrapingu uživatelský účet, což je ve smluvních podmínkách zakázáno. Metě se toto tvrzení ale nepovedlo dokázat a žalobu zrušila. (Perez, 2024)

eBay vs Bidder’s Edge

Jedna z hlavních funkcí eBay je aukce zboží. Bidder’s Edge je firma, která scrapovala data ohledně cen nabízeného zboží a používala je ve formě srovnávače cen. To umožnovalo jejím zákazníkům snadno porovnávat ceny na stránkách jako je eBay ve srovnání s jinými službami. Množství HTTP dotazů, které bylo na server eBay vysláno bylo přibližně 100 000 denně, což bylo zhruba 1,53 % ze všech požadavků. eBay žaloval úspěšně Bidder’s Edge na základě doktríny narušení movité věci. Na základě toto byly aktivity Bidder’s Edge přerušeny. (Samson, 2024)

Facebook vs Power Ventures

Power Ventures byla služba, která spojovala jendotlivé sociální sítě v jednu platformu. Uživatel jí poskytl přihlašovací údaje k sociálním sítím a Power Ventures integrovala jejich účet na platformu. Podle Facebooku během přihlašování udělala Power Ventures kopii jejich stránky a tím přímo i nepřímo porušilo autorská práva. Facebook proti Power Ventures podal žalobu za porušení autorského práva, DMCA, CFAA, ochranné známky a další. Soud uznal žalobu podle CFAA a podle CAN-SPAM Act. CFAA se zabývá využitím neoprávněné autorizace a CAN-SPAM Act slouží proti rozesílání komerčních emailů, které mají zavádějící obsah. Power Venture podle rozhodnutí soudu mělo zaplatit 3 miliony dolarů. (Shrapiro et al., 2017)

8 Závěr

Webscraping je technika, která je široce využívaná pro získávání informací z webu. Uplatnění má v komerční, ale i akademické sféře. V kontextu Competitive intelligence je webscraping používán pro získávání informací o konkurenci a externím prostředím. Tyto informace můžou být následně využívány pro podporu rozhodování. Technologická implementace je závislá na specifické úloze, jelikož můžou být velké rozdíly ve struktuře dat a jejich objemu.

Z hlediska práva není webscraping ilegální, ale často se pohybuje v „šedé zóně“. Před implementací je potřeba se zamyslet, zda projekt neporušuje některý ze zákonů, například GDPR, autorské právo, ochrannou známku či poškození majetku. Důležitá je i etická stránka projektu, aby projekt neškodil okolí. Může proto být vhodné při posuzování projektu následovat framework pro webscraping, například ten, co byl v této práci zmíněn. Ten stanovuje otázky, které je potřeba zodpovědět a dá se podle nich posoudit legálnost a etičnost projektu.

9 Zdroje

Krotov, V., Johnson, L., & Silva, L. (2020). Tutorial: Legality and Ethics of Web Scraping. Communications of the Association for Information Systems, 47, pp-pp. https://doi.org/10.17705/1CAIS.04724 

ZHAO, Bo. Web Scraping. Online. 2017, s. 3. Dostupné z: https://doi.org/10.1007/978-3-319-32001-4_483-1. [cit. 2024-05-30].

Competitive Intelligence Information: A Key Business Success Factor. Online. 2014, roč. 2014, č. 2. 2014. ISSN 1925-4733. Dostupné z: https://www.academia.edu/67642377/Competitive_Intelligence_Information_A_Key_Business_Success_Factor?auto=download. [cit. 2024-05-31].

AHMAD KHDER, Moaiad. Web Scraping or Web Crawling: State of Art, Techniques, Approaches and Application. Online. International Journal of Advances in Soft Computing. Roč. 2021, s. 24. Dostupné z: https://doi.org/10.15849/IJASCA.211128.11. [cit. 2024-05-31].

KROTOV, Vlad a SILVA, Leiser. Legality and Ethics of Web Scraping. Online. 2018. Dostupné z: https://www.researchgate.net/publication/324907302_Legality_and_Ethics_of_Web_Scraping. [cit. 2024-05-31].

HO, Hoang Phuong Thao. LEVERAGING WEB SCRAPING FOR COLLECTING COMPETITIVE MARKET DATA. Online, Bachelor’s thesis. LAB UNIVERSITY OF APPLIED SCIENCES LTD, 2020. Dostupné z: https://www.theseus.fi/bitstream/handle/10024/352844/Ho_Thao.pdf?sequence=2&isAllowed=y. [cit. 2024-05-31].

PAGALLO, Ugo a SCILLA, Jacopo Ciani. Anatomy of web data scraping: ethics, standards, and the troubles of the law. Online. Roč. 2024, s. 12. Dostupné z: https://deliverypdf.ssrn.com/delivery.php?ID=156082089114108071084095083118112102002054084092007058124026030088064094014089125096027019013002018046016025092064088076081117059084071008033070124011067080028004094019081083091002081013116096118100115016023083077119011117005067088082027083080101006074&EXT=pdf&INDEX=TRUE. [cit. 2024-05-31].

JOSHI, Asmit. Legality of Web Scraping — An Overview. Online. Medium. 2021. Dostupné z: https://medium.com/grepsr-blog/legality-of-web-scraping-an-overview-3cf415885e16. [cit. 2024-05-31].

WILLIAMSON, Neil a LAMBERTUS, Colin. EU: Data scraping – navigating the challenges old and new. Online. Data Guidance. 2023. Dostupné z: https://www.dataguidance.com/opinion/eu-data-scraping-–-navigating-challenges-old-and-new. [cit. 2024-05-31].

DENSMORE, James. Ethics in Web Scraping. Online. Medium. 2017. Dostupné z: https://towardsdatascience.com/ethics-in-web-scraping-b96b18136f01. [cit. 2024-05-31].

GALLESE, Chiara. Web scraping and Generative Models training in the Directive 790/19. Online. Roč. 2024, s. 16. Dostupné z: https://doi.org/10.6092/issn.1825-1927/18871. [cit. 2024-05-31].ko

SHAPIRO, Ilya; BURRUS, Trevor a WATKINS, Devin. Power Ventures v. Facebook. Online. Cato institute. 2017. Dostupné z: https://www.cato.org/legal-briefs/power-ventures-v-facebook. [cit. 2024-05-31].

PEREZ, Sarah. Meta drops lawsuit against web-scraping firm Bright Data that sold millions of Instagram records. Online. Cato institute. 2024. Dostupné z: https://techcrunch.com/2024/02/26/meta-drops-lawsuit-against-web-scraping-firm-bright-data-that-sold-millions-of-instagram-records/. [cit. 2024-05-31].

SAMSON, Martin. Ebay Inc. v. Bidder’s Edge, Inc. Online. Internet Library of Law and Court Decisions. 2000. Dostupné z: http://www.internetlibrary.com/cases/lib_case249.cfm. [cit. 2024-05-31].

Data Governance: přehled trendů pro rok 2024

0
turned on monitoring screen

Úvod

V současném digitálním světě se zvyšuje význam správy a řízení datových aktiv. Data Governance je organizací DAMA International definována jako výkon autority a kontroly nad řízením datových aktiv. Organizace si postupně uvědomují, že data nejsou jen vedlejším produktem jejich činnosti, ale strategickým aktivem, které může přinést konkurenční výhodu. Data Governance neboli správa dat, se proto stává zásadním prvkem v podnikových strategiích. Tento koncept zahrnuje celou řadu procesů, pravidel a standardů, které mají za cíl zajistit kvalitu, bezpečnost a dostupnost dat v rámci organizace. (Data Administration Management Association et al., 2017)

Cíle analýzy

Hlavním cílem této analýzy je zhodnotit současný stav a význam správy dat (Data Governance). Zaměřuje se na identifikaci trendů a na hodnocení celkové atraktivity tohoto odvětví a jeho budoucího vývoje. Specifické cíle zahrnují:

  • Analýzu rostoucího významu správy dat.
  • Identifikaci klíčových oblastí a trendů správy dat na základě aktuálních studií a statistik.

Metodologie dosažení cílů

Pro dosažení cílů analýzy bude použita následující metodologie:

  • Prozkoumání odborné literatury, článků a studií týkajících se správy dat (Data Governance).
  • Analýza historického vývoje a aktuálních trendů v oblasti Data Governance s důrazem na významné události a změny.
  • Analýza vývoje a frekvence zmínek o Data Governance od roku 1990 do současnosti s využitím dostupných statistik a grafů.
  • Vyhodnocení výsledků studií jako BARC Data, BI and Analytics Trend Monitor 2024 a predikcí od Gartneru pro oblast dat a analytiky do roku 2028.

Rostoucí zájem o data governance

Napsané zmínky o „data governance“ od roku 1990 ukazují zajímavý trend. Termín „data governance“ se začal objevovat častěji v polovině až koncem 90. let, kdy se začínají rozvíjet praktiky správy dat. V prvním desetiletí 21. století narůstá frekvence, protože digitální data se stávají důležitými pro obchodní operace. Významný nárůst používání v druhém desetiletí 21. století odráží rostoucí důležitost správy dat s příchodem velkých dat, předpisů o ochraně dat (jako GDPR) a obecného důrazu na rozhodování založeného na datech. (Google Books Ngram Viewer, b.r.)

1 Vývoj frekvence používání termínu „Data Governance“ v knihách od roku 1990 do roku 2019

Graf vyhledávání termínu „Data governance“ na Google v období od roku 2004 do května 2024 ukazuje, že zájem o správu dat postupně rostl a v posledních letech dosáhl nových vrcholů. V počátečních letech byl zájem nízký, ale od roku 2008 začal pomalu růst, což odráží rostoucí uvědomění si významu kvalitních dat pro podnikání. Od roku 2015 zájem výrazně vzrostl, pravděpodobně v reakci na rychlou expanzi digitálních dat, přísnější regulační požadavky a dostupnost pokročilých technologií pro správu dat. V posledních letech, zejména během pandemie COVID-19, se význam správy dat ještě více zvýšil. (Google Trends, b.r.)

2 Trend vyhledávání termínu „Data Governance“ na Google v období od roku 2004 do roku 2023

BARC Data, BI and Analytics Trend Monitor 2024 ukazuje, že Data Governance zaujímá podstatnou roli v aktuálních trendech datové analytiky a řízení dat. Data Governance se v roce 2024 umístila na třetím místě v důležitosti, což zdůrazňuje její rostoucí význam pro organizace. Vysoké hodnocení Data Governance svědčí o tom, že organizace stále více investují do strategií a procesů, které zajišťují kvalitu, bezpečnost a dostupnost dat. Rovněž to ukazuje na důraz, který organizace kladou na data jako strategický zdroj pro rozhodování a inovace. Celkově infografika potvrzuje, že data governance je zásadním faktorem pro úspěšné využívání dat v podnikání a technologických strategiích.(BARC, 2023)

Predikce pro oblast dat a analytiky do roku 2028 od Gartneru zdůrazňují rostoucí význam data governance. Do roku 2026 bude 15 % velkých podniků hodnotit propojené governance programy pro efektivní řízení složitých meziorganizačních problémů. Očekává se, že 80 % organizací zavede více datových center v rámci své datové infrastruktury pro sdílení a řízení dat, a 20 % velkých podniků bude používat jednotnou platformu pro správu a automatizaci governance programů. Do roku 2026 se také rozšíří používání podnikových datových katalogů, což sníží adopci analytických katalogů alespoň o 20 %, a počet organizací využívajících aktivní praktiky metadat se zvýší na 30 %. Tyto trendy podtrhují význam Data Governance jako podstatný faktor pro úspěšné využívání dat a analytiky v organizacích. (Sarah James, Alan D. Duncan, 2023)

Hype cycle pro data a analytiku

Hype Cycle for Data and Analytics Governance 2023 poskytuje podrobný přehled o fázích vývoje různých technologií a inovací v oblasti správy dat a analytiky, znázorněných na grafu, který rozděluje tento vývoj do pěti hlavních fází. Na vodorovné ose je zobrazen čas a na svislé ose jsou očekávání. Každá technologie je také označena odhadem, za jak dlouho dosáhne svého vrcholu produktivity, přičemž bílý kruh znamená méně než 2 roky, modrý kruh 2–5 let, tmavě modrý kruh 5–10 let a žlutý trojúhelník více než 10 let. Symbol červeného kříže označuje technologie, které se stanou zastaralými před dosažením produktivní fáze. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Fáze „Innovation Trigger“ je počátečním bodem, kdy se objevují nové technologie, které vyvolávají zájem médií a průmyslu. V této fázi se nacházejí oblasti jako „Connected Governance“ a „D&A Governance Platforms“. Tyto oblasti jsou teprve na začátku svého vývoje, a ještě nejsou široce adoptované ani osvědčené v praxi. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Následuje fáze „Peak of Inflated Expectations“, kde technologie dosahují vrcholu nadsazených očekávání. Zde se nacházejí například „Governance of Digital Twins“, „Augmented MDM“, „AI Governance“ a „Augmented Data Quality“. V této fázi technologie získávají velkou pozornost a očekávání často přesahují reálné možnosti. Investice a zájem o tyto technologie jsou na vrcholu, ale reálné výsledky častokrát nedosahují očekávání. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Ve fázi „Trough of Disillusionment“ dochází k poklesu nadšení, když se projeví problémy s výkonem a adopcí technologií. Technologie jako „D&A Stewardship“ a „Application Data Management“ se v této fázi nacházejí, protože organizace zjišťují, že realita neodpovídá počátečnímu nadšení. Některé technologie mohou být v této fázi dokonce opuštěny. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Fáze „Slope of Enlightenment“ nastává, když se technologie začínají zotavovat z předchozí fáze a organizace začínají získávat reálné zkušenosti a pochopení jejich skutečné hodnoty. Příkladem jsou „Customer MDM „, „Master Data Management“ a „Multidomain MDM Solution“. V této fázi se technologie postupně zlepšují a organizace začínají chápat, kde a jak je lze efektivně využít. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Poslední fáze „Plateau of Productivity“ představuje moment, kdy technologie dosahují široké adopce a prokazují svou hodnotu v praxi. Technologie jako „Product Data MDM“ se zde nachází, protože již prokázala svou užitečnost a stala se běžnou součástí praxe v mnoha organizacích. Adopce těchto technologií je na vzestupu a jejich riziko je výrazně sníženo. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Hype Cycle poskytuje strategické rady pro organizace, kdy investovat do nových technologií a kdy počkat na jejich zralost. Doporučuje se vyhnout investicím do technologií pouze na základě nadšení, ale zároveň neignorovat technologie, které neodpovídají počátečním očekáváním. Organizace by měly být selektivně agresivní a investovat do technologií, které jsou pro jejich podnikání potenciálně přínosné, a využívat Priority Matrix pro hodnocení potenciálních výhod každé inovace. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Innovation Trigger

Inovační spouštěč zahajuje období rychlého vývoje a rostoucího zájmu a může jím být uvedení nového produktu, zlepšení cena/výkon, přijetí respektovanou organizací nebo nárůst mediálního zájmu. Může jít také o vnější podnět mimo IT, jako je nová legislativa nebo ekonomická či politická krize. Některé inovace mají dlouhé období výzkumu a vývoje před dosažením rozhodujícího bodu. Hype Cycle začíná, když dostatečný počet zainteresovaných stran diskutuje o potenciálu inovace. Časový rozdíl mezi spouštěčem a vrcholem je často krátký. Sociální média mají obzvláště krátké období před vrcholem. Indikátory že inovace překonala spouštěč, zahrnují dostupnost k prodeji, omezený počet dodavatelů, potřebu úprav pro provozní prostředí a vysokou cenu. (Understanding Gartner’s Hype Cycles, 2018)

Connected Governance

Propojená správa (Connected Governance) je rámec, který poskytuje agilní reakci na scénáře, které zahrnují více podniků a geografických oblastí. Tento rámec umožňuje představenstvu dohodnout se na odpovědnosti pro aktivity jako je například dodržování GDPR v rozhodujících obchodních procesech. Dotčené orgány správy následně posoudí proveditelnost a dopad těchto požadavků na jejich současné operace. Tým pro propojenou správu musí vytvořit rámec a virtuální organizační strukturu, která zahrnuje zapojené osoby, jejich role a odpovědnosti, definování kritických obchodních procesů a identifikaci ukazatelů výkonu. Rámec využívá části existující správy v organizacích a umožňuje řešit složité problémy bez přidávání dalších vrstev byrokracie. (Guido De Simoni, Saul Judah, 2022; Guido De Simoni, Saul Judah, Andrew White, 2023)

Nicméně propojená správa nemusí být efektivní, pokud existující orgány správy fungují špatně, silové snahy brání výhodám propojené správy nebo se technologické platformy mění a nejsou kompatibilní s budoucími potřebami. Proto je důležité identifikovat strategické otázky vyžadující koordinovanou správu a navrhnout koncept propojené správy s využitím schopností platformy pro správu dat a analytiky. Technologie by neměly bránit propojení organizačních snah, ale měly by být využity k umožnění propojené správy. Tento rámec umožňuje organizacím efektivněji reagovat na měnící se tržní podmínky a nové regulace prostřednictvím koordinované správy a technologií. (Guido De Simoni, Saul Judah, 2022; Guido De Simoni, Saul Judah, Andrew White, 2023)

D&A Governance Platforms

Platformy pro správu dat a analýz (D&A) představují sadu integrovaných technologických funkcí, které pomáhají řídit a spravovat řadu politik týkající se zabezpečení, kvality, přístupu, uchovávání, ochrany osobních údajů a etiky. Poskytuje uživatelské prostředí pro nastavení a prosazování těchto zásad všem relevantním účastníkům. V současnosti je správa a řízení dat nejednotná, protože různé organizace používají různé technologie, což brání úspěchu. Soudržná technologická podpora může výrazně zlepšit všechny aspekty správy. Vedoucí pracovníci v oblasti D&A, kteří přijmou tyto platformy, budou mít prospěch ze schopnosti zmírnit riziko problémů, zvýšené produktivity, efektivity procesů správy a důvěry v data a analytiku. Tyto platformy také přinášejí nové možnosti objevování dat a jejich vztahů. Dále je vhodné minimalizovat počet nasazených nástrojů. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Data Security Governance

Správa zabezpečení dat (DSG) umožňují organizacím posoudit a stanovit priority obchodních rizik spojených se zabezpečením dat, ochranou osobních údajů a dodržováním předpisů. Tímto způsobem mohou organizace zavést efektivní správa zabezpečení dat, které podporují obchodní výsledky a vyvažují rizika. DSG nabízí vyvážený přístup k určení, jak mají být data přístupná a využívána k podpoře obchodních cílů a zlepšení zákaznické zkušenosti, přičemž současně prosazuje vhodná opatření k zabezpečení dat a ochraně osobních údajů, aby se zmírnila rizika. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Adaptive D&A Governance

Adaptivní správa dat umožňuje organizacím flexibilně reagovat na měnící tržní prostředí a efektivně využívat investice, minimalizovat rizika a maximalizovat hodnotu dat. Tento přístup podporuje pružné a pohotové rozhodovací procesy, které reflektují aktuální potřeby a strategie organizace. Adaptivní správa dat a analytiky představuje transformaci způsobů, jakými organizace využívají správu dat a mají z ní prospěch. Přijímání adaptivní správy dat ovlivňuje celou organizaci, nikoliv pouze datové programy. Aby správa dat přinášela obchodní hodnotu, musí být flexibilní a dynamická, aby vyhovovala měnícím se potřebám organizace. Na rozdíl od tradiční správy dat adaptivní přístup umožňuje organizacím lépe vyvažovat omezení a volnost při implementaci změn, což jim umožňuje lépe reagovat na dynamické tržní prostředí a využívat data jako strategický zdroj k dosažení dlouhodobých cílů. Gartner odhaduje, že do roku 2025 selže 80 % organizací, které se pokoušejí rozšířit digitální podnikání, protože nepřistupují ke správě dat moderním způsobem. (Gartner, 2022; Guido De Simoni, Saul Judah, Andrew White, 2023; Laurence Goasduff, 2022)

Data Observability

Data observability je technologie, která umožňuje organizacím neustále monitorovat, sledovat, upozorňovat a řešit problémy s datovou infrastrukturou, čímž snižuje a předchází chybám dat nebo výpadkům systému. Poskytuje přehled o tom, co se pokazilo na základě dohodnutých SLA (Service-level agreement) pro kvalitu a používání dat, hodnotí dopady a doporučuje řešení, čímž zlepšuje spolehlivost dat. Využíváním profilování dat, umělé inteligence nebo strojového učení a aktivních metadat hodnotí kvalitu dat, detekuje problémy, odesílá včasná upozornění, provádí analýzu příčin a poskytuje doporučení k řešení a prevenci problémů. To zajišťuje, že technické týmy mohou udržovat data, předcházet neplánovaným výpadkům a zlepšovat viditelnost kvality dat pro obchodní uživatele. Organizacím se doporučuje otestovat programy pozorování dat, upřednostňovat spolupráci mezi obchodem a IT a demonstrovat hmatatelné výhody sledováním zlepšení kvality dat a provozní efektivity. (Guido De Simoni, Saul Judah, Andrew White, 2023)

At the peak

V období na vrcholu nafouknutých očekávání je inovace hlavním tématem na sociálních sítích. Investoři chtějí mít tuto inovaci ve svém portfoliu, což podporuje vznik podobných společností. Jak se inovace šíří, přední společnosti ji přijímají, aby nezůstaly pozadu. Dochází k hromadnému efektu, kdy je inovace považována za univerzální řešení, bez ohledu na její vhodnost. Posiluje nadšení a tlak na přijetí inovace je intenzivní, často bez úplného pochopení všech rizik. Inovace jsou mnohdy tlačeny na hranici svých možností. Nadšení může trvat několik měsíců až několik let. (Understanding Gartner’s Hype Cycles, 2018)

AI Governance

Správa umělé inteligence (AI governance) je stále více uznávána pro zajištění etického a efektivního využití AI technologií. Správa AI je definována jako struktura pravidel, praktik a procesů, které zajišťují, že technologie AI podporuje a rozvíjí strategie a cíle organizace. Správa umělé inteligence je součástí adaptivní správy dat a analytiky, která se zabývá prediktivní a generativní povahou umělé inteligence. Generativní umělá inteligence a aplikace, jako je ChatGPT společnosti OpenAI, činí správu umělé inteligence nezbytnou. Používání předtrénovaných modelů umělé inteligence násobně stupňuje obavy z možných nebezpečí a rizik. Odpovědná umělá inteligence poskytuje společné mechanismy implementace a dodržování ohledně etiky a bezpečnosti. Důvěryhodnost a transparentnost zavádění AI je zajištěna prostřednictvím vysvětlitelnosti, zmírňování zkreslení, správy modelů a norem. Správa umělé inteligence minimalizuje nesprávné interpretace výsledků AI tím, že důkladně zkoumá důvěryhodnost zdrojů dat a vysvětlitelnost rozhodnutí AI. (Guido De Simoni, Saul Judah, Andrew White, 2023; Mäntymäki et al., 2022)

Augmented MDM

Augmented master data management (MDM) využívá grafovou analytiku, strojové učení a další pokročilé technologie k rozšíření tradičních schopností MDM, což snižuje manuální úkoly v oblasti správy dat. Tento přístup pomáhá nahlédnout do komplexních vztahů mezi aplikacemi a kmenovými daty, umožňující technologii aktivně podporovat adaptivnější a kontextově orientované přístupy k řízení kmenových dat. Augmented MDM je důležitý pro organizace, které chtějí urychlit digitální transformace, zejména pro oblasti zákazníků a produktů. Pomocí strojového učení a grafové analýzy lze identifikovat zdroje kmenových dat, odhalit dříve neznámé vztahy mezi entitami kmenových dat a zrychlit procesy, jako je řešení entit a kvalita dat. Augmented MDM umožňuje zvýšit příjmy díky rychlejšímu zpracování velkých datových souborů a zlepšení provozní efektivity snížením nákladů na provoz MDM programů. Přestože augmented MDM přináší mnoho výhod, je stále ve fázi vývoje, a to jak z pohledu poptávky zákazníků, tak zaměření dodavatelů. Doporučuje se pečlivě zvážit nabídky dodavatelů, kteří se zaměřují především na augmented MDM, a posoudit očekávané obchodní výsledky a případy užití. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Responsible AI

Odpovědná umělá inteligence (AI) je široký pojem, který zahrnuje aspekty správných obchodních a etických rozhodnutí při přijímání AI. Odpovědná umělá inteligence zahrnuje organizační povinnosti a postupy, které zajišťují pozitivní, odpovědný a etický vývoj a provoz AI. V případech, kdy AI nahrazuje lidská rozhodnutí a vytváří nové artefakty, zesiluje jak pozitivní, tak negativní výsledky. Odpovědná AI umožňuje dosáhnout správných výsledků tím, že zajišťuje obchodní hodnotu a současně zmírňuje rizika. Vyžaduje to sadu nástrojů a metod, které jsou přijímány podniky, a stále více zavádí nové předpisy, které vyzývají organizace k odpovědným reakcím. Odpovědná umělá inteligence pomáhá získat důvěru a zajistit dodržování předpisů. Důležitost odpovědné AI stále roste, protože ovlivňuje všechny aspekty života a dotýká se všech vrstev společnosti. Zároveň s tím, jak se AI technologie rychle vyvíjejí, vznikají nové problémy, jako je používání ChatGPT nebo detekce deepfake. Organizace musí kombinovat různé aspekty odpovědné AI, jako je odpovědnost, diverzita, etika, vysvětlitelnost, spravedlnost, zaměření na člověka, provozní odpovědnost, soukromí, dodržování předpisů, řízení rizik, bezpečnost, transparentnost a důvěryhodnost.(Guido De Simoni, Saul Judah, Andrew White, 2023; Mäntymäki et al., 2022)

Governance of Digital Twins

Digitální dvojče je digitální reprezentace reálné entity nebo systému. Správa digitálních dvojčat je zásadní pro dosažení trvalé hodnoty, protože tradiční projektové přístupy k zavádění digitálních dvojčat neudrží hodnotu digitálních dvojčat po dlouhou dobu spojenou s mnoha fyzickými předměty, které představují. Organizace, které spravují digitální dvojčata, budou nejlépe připraveny dosáhnout dobrých obchodních výsledků. Neexistence průmyslových standardů nebo společných integračních rámců pro data, modely, analytiku nebo bezpečnost digitálních dvojčat často vede k jejich izolované správě, namísto integrované správy jako součásti investic. Doporučuje se vytvořit rámec pro správu digitálních dvojčat, která zdůrazňuje odpovědnost, předvídatelnost a transparentnost, a zajišťuje, aby všichni relevantní účastníci věděli, co se od nich očekává, jak budou informováni o výsledcích a jaké kroky budou podniknuty. (Definition of Digital Twin – Gartner Information Technology Glossary, b.r.; Guido De Simoni, Saul Judah, Andrew White, 2023)

Augmented Data Quality

Augmented data quality (ADQ) poskytuje schopnosti pro zlepšení objevování informací, návrhy na další kroky a automatizaci pomocí umělé inteligence (AI), strojového učení (ML), grafové analýzy a analytiky metadat. Tyto technologie mohou pracovat samostatně i společně, čímž vytvářejí síťové efekty, které zvyšují automatizaci a efektivitu řízení kvality dat napříč různými případy užití. ADQ technologie transformují konvenční a časově náročné manuální postupy tím, že zvyšují automatizaci a zlepšují vhledy. Zajištění vysoké kvality dat je zásadní pro datové a analytické snahy, zejména vzhledem k rychlému rozšiřování moderních datových prostředí a naléhavým požadavkům podniků. Augmented data quality umožňuje organizacím zlepšit provozní efektivitu snížením nákladů na provoz programů řízení kvality dat. Přijetí ADQ řešení a využití nových technologií je důležité pro zlepšení integrity dat, správy dat a celkového úspěchu v datovém ekosystému. (Guido De Simoni, Saul Judah, Andrew White, 2023)

Dvanáct trendů Data Governance

Atlan je moderní platforma pro správu dat, která umožňuje týmům efektivně spolupracovat a spravovat data v rámci celé organizace. Atlan integruje různé zdroje dat a poskytuje nástroje pro katalogizaci, profilování, monitorování a správu dat, což usnadňuje jejich nalezení, porozumění a využití. Díky využití umělé inteligence a automatizace Atlan zjednodušuje procesy správy dat, minimalizuje manuální práci a zlepšuje kvalitu dat. Na svém blogu Atlan zveřejnil 12 trendů správy dat pro rok 2024, čímž ukazuje své vedoucí postavení a aktuálnost v oblasti data governance. (The Top 12 Data Governance Trends in 2024, 2023)

Mezi klíčové trendy patří:

•          Využití umělé inteligence a strojového učení při správě dat

•          Ochrana osobních údajů a soulad s novými předpisy

•          Správa kvality dat

•          Správa datových linií a metadat

•          Integrace cloudových řešení

•          Decentralizované modely správy dat

•          Správa dat v reálném čase

•          Data jako služba (DaaS)

•          Zvýšený důraz na etiku dat

•          Spolupráce a zapojení komunity do správy dat

•          Vznik datových jezer a datových katalogů

•          Demokratizace dat

Tyto trendy ukazují směr, kterým se oblast data governance ubírá, a zahrnují nové technologie a přístupy, jako je AI, strojové učení, ochrana osobních údajů, integrace cloudových řešení a další. Každá organizace by měla tyto trendy přizpůsobit svým specifickým potřebám a nesnažit se pouze následovat přehnaná očekávání. Přijetím těchto trendů mohou organizace zlepšit správu dat, splnit regulační požadavky a strategicky využít data k dosažení svých obchodních cílů.

Závěr

Lze konstatovat, že Data Governance se stává nepostradatelným prvkem v organizacích, které usilují o získání konkurenční výhody prostřednictvím strategického využití dat. Od svého vzniku na konci 20. století prošel tento koncept významným vývojem, zejména v reakci na nárůst objemu dat a zavedení přísnějších regulačních požadavků, jako je GDPR. V posledních letech pandemie COVID-19 ještě více zdůraznila potřebu efektivní správy dat.

Současné trendy, jak ukazují různé studie a zprávy, včetně BARC Data, BI and Analytics Trend Monitor 2024 a predikcí od Gartneru, potvrzují rostoucí důležitost Data Governance. Organizace stále více investují do technologií a procesů, které zajišťují kvalitu, bezpečnost a dostupnost dat, což je klíčové pro jejich úspěch. Vývoj v oblasti adaptivní správy dat a nových technologií, jako je AI governance, poskytuje organizacím nástroje pro efektivní a etické využívání dat.

Pro úspěšnou správu datových aktiv je nezbytné nejen sledovat aktuální trendy a technologie, ale také strategicky plánovat jejich implementaci s ohledem na specifické potřeby organizace. Pouze tak mohou organizace plně využít potenciál, který Data Governance nabízí, a dosáhnout dlouhodobého úspěchu v dynamickém a vysoce konkurenčním prostředí.

Zdroje

BARC. (2023). Data, BI and Analytics Trend Monitor 2024. https://barc-research.com/research/bi-trend-monitor/bi-trend-monitor-registration/

Data Administration Management Association, Henderson, D., & Earley, S. (Ed.). (2017). DAMA-DMBOK 2: Data management body of knowledge (Second edition). Technics Publications.

Definition of Digital Twin—Gartner Information Technology Glossary. (b.r.). Gartner. Získáno 28. květen 2024, z https://www.gartner.com/en/information-technology/glossary/digital-twin

Gartner. (2022, duben 11). Why Modern Digital Organizations Need Adaptive Data Governance. Gartner. https://www.gartner.com/en/articles/choose-adaptive-data-governance-over-one-size-fits-all-for-greater-flexibility

Google Books Ngram Viewer. (b.r.). Získáno 26. květen 2024, z https://books.google.com/ngrams/graph?content=data+governance&year_start=1990&year_end=2019&corpus=en-2019&smoothing=3#

Google Trends. (b.r.). Google Trends. Získáno 26. květen 2024, z https://trends.google.com/trends/explore?date=2004-01-01%202024-05-26&q=Data%20governance&hl=cs

Guido De Simoni, Saul Judah. (2022). Connected Governance Drives Adoption of Data and Analytics Governance Platforms. https://anjanadata.com/wp-content/uploads/2023/01/Connected_Governance_766474_ndx-1.pdf

Guido De Simoni, Saul Judah, Andrew White. (2023, červenec 26). Hype Cycle for Data and Analytics Governance, 2023. https://www.gartner.com/doc/reprints?id=1-2EUSIGSM&ct=230831&st=sb

Laurence Goasduff. (2022). Choose Adaptive Data Governance Over One-Size-Fits-All for Greater Flexibility. https://www.gartner.com/en/articles/choose-adaptive-data-governance-over-one-size-fits-all-for-greater-flexibility

Mäntymäki, M., Minkkinen, M., Birkstedt, T., & Viljanen, M. (2022). Defining organizational AI governance. AI and Ethics, 2(4), 603–609. https://doi.org/10.1007/s43681-022-00143-x

Sarah James, Alan D. Duncan. (2023). Over 100 Data and Analytics Predictions Through 2028. Gartner. https://emt.gartnerweb.com/ngw/globalassets/en/doc/documents/over-100-data-and-analytics-predictions-through-2028-1.pdf?_gl=1*mal4rz*_ga*MzkxMDgxMTQyLjE3MTUyNjgyOTA.*_ga_R1W5CE5FEV*MTcxNjc5OTU4NS4zLjEuMTcxNjc5OTYxNi4yOS4wLjA.

The Top 12 Data Governance Trends in 2024. (2023, srpen 4). https://atlan.com/data-governance-trends/

Understanding Gartner’s Hype Cycles. (2018, srpen 20). Gartner. https://www.gartner.com/en/documents/3887767

Využití Competitive Intelligence v oblasti strategy consulting

0

Použití termínu “dynamické odvětví“ v souvislosti se strategy connsultingem může působit jako klišé, nicméně jsem přesvědčen, že pro toto odvětí platí mnohem více než pro jiná business odvětví. Poslední roky se dramaticky do způsobu práce konzultantů a nabízených služeb promítá příchod umělé inteligence, ekonomická situace a digitalizace procesů. Co tedy všechno strategy consulting obnáší a jakou roli v této oblasti sehrává Competetive Intelligence?

Strategy consulting je oblast poradenství, která se, jak už z názvu vyplývá, specializuje zejména na strategie – jejich definování, implementace, změny. Charakteristickým rysem pro strategy konzultanty je, že na projektech u klientů pracují přímo pro vedení společnosti či vrcholové manažery jednotlivých oddělení. Důsledek jejich práce s nejužším vedením spočívá v tom, že projekty, které zpracovávají, mají často celofiremní konsekvence týkající se směru, kterým se firma bude v budoucnu ubírat. Nezřídka kdy bývají jejich klienty i veřejné instituce. Přesah strategy konzultantů bývá často tedy i celospolečenský. Toto je klíčový rozdíl oproti jiným konzultačním oblastím (IT, daně, účetnictví, udržitelnost), které v zásadě můžou mít obdobně celopodnikové dopady, nicméně řeší se primárně určitou firemní výseč, nikoliv směřování firmy jako celku.

Avšak v dnešní době, kdy není o vágní vymezení a termíny nouze, tento termín často splyne s ostatními. Poradenské firmy často používají spojení strategy consulting jako marketingový buzzword a nabízejí pod názvem strategické poradenství jiné služby. Toto je dáno pověstí o cenách za člověkoden a kvalitách služeb, které proslavené strategické konzultační firmy nabízejí. V tomto případě mám na mysli zejména firmy jako McKinsey, BCG, Bain a další. Za posledních zhruba 15 let i všechny firmy z velké čtyřky založily oddělení či dceřinné společnosti, které se zabývají pouze strategy consultingem. EY má dceřinou společnost EY Parthenon, Deloitte založil Deloitte Monitor, PwC vlastní síť strategických konzultaček jménem Strategy&.

Calof et al. (2017) poukazuje na fakt, že aplikace CI prvků v Evropě se oproti počátku století velmi rozšířila a pro některé firmy se stala nepostradatelnou komponentou. Důraz je hlavně kladen na zpravodajství týkající se zákaznických dat, technologií a R&D. Calof zároveň poukazuje na srovnání předchozích dostupných studií s aktuálními, kdy kolem roku 2006 pouze 18% dotázaných firem mělo formalizované používání CI. V roce 2017 už to bylo kolem 83%.

Specifika práce strategy konzultantů

Pro lepší pochopení využití CI ve strategy consultingu je důležité si uvést specifika této práce. Konzultanti za prací (obzvlášť v Evropě) poměrně často cestují do zahraničí. Bývá běžné, že v průběhu roku pracují na projektech v několika zemích najednou. Což je výzva zejména z pohledu pochopení tamější legislativy, regulatoriky nebo kulturních odlišností. Velice často zpracovávají problémy nebo požadavky v oblastech, které v minulosti nikdy neřešili. Zároveň jejich práce musí obsahovat vysokou míru detailu a konzultanti samotní musí mít vysokou schopnost rozhodování. Tento výčet se do jisté míry podobá práci operativců zpravodajských služeb – pracují často v neznámém prostředí, mají omezené množství prvotních informací, ale je velký nárok na správná rozhodnutí. Toto porovnání se může na první pohled zdát neadekvátní, nicméně např. ve Spojených státech amerických je poměrně běžné, že pracovníci zpravodajských služeb přecházejí na manažerské pozice do konzultačních firem (přikládám 2 příklady Gordon Welch a John Shumadine)

Z výše uvedeného vyplývá, že prvky Competitive Intelligence jsou nedílnou součástí práce konzultantů. Denním chlebem jsou činnosti jako hledání výročních zpráv, rešerše konkurence, studie úspěšnosti na trzích, analýza legislativního prostředí, sběr dat a informací.

V následujících odstavcích se pokusím zaměřit na 3 Competitive Intelligennce praktiky (Open Source Intelligence, Competitive Landscape Analysis a užívání velkých jazykových modelů), které konzultační firmy využívají nebo mohou využívat pro splnění klientských zadání. Samotný Open Source Intelligence lze rozdělit na další podskupiny jako Geospatial Intelligence, Human Itnelligence a další. Ty však nejsou pro oblast strategy consultingu příliš relevantní nebo mohou kolidovat s určitými morálními postupy a proto se jim v následujícím textu nebudu věnovat.

OSINT[1]

Open Soure Intelligence je zpravodajství z otevřených zdrojů, tj. zpravodajství z jakýchkoliv veřejně dostupných informací, jejichž shromáždění nevyvolává důsledky právní povahy (Lutai a Mihaescu, 2023). OSINT je nejčastěji spojován s prací zpravodajských služeb nebo jako komponenta cyber security. Princip OSINT – tedy v podstatě dolování informací z otevřených zdrojů, je však bez problémů uplatnitelný a stále více aplikovaný i v business světě.

Lutai a Mihaescu (2023) rozdělují OSINT na dvě skupiny.

  1. Tradiční otevřené zdroje – Do této kategorie se řadí první otevřené zdroje, které nabývaly podoby novinových článků, knih nebo rozhlasových přenosů. Oba autoři připouští, že ačkoliv se nejedná o nejagilnější nástroj, obzvláště knihy či odborné články mohou být neustále v business světě platným pomocníkem pro řešení projektových výzev.
  2. Digitální otevřené zdroje – Do této kategorie se řadí weby, sociální sítě a stránky poskytující open data.

Vyhledávače

Na první pohled možná může působit zmínka o vyhledávačích v rámci OSINT lehce zbytečně, jelikož se jedná o nejpřímočařejší praktiku, nicméně umět dobře pracovat s vyhledávačem je klíčové a spoustu pracovníků omezuje limitující znalost jejich vyhledávacích praktik. Myšlenou nadstavbou je např. rozšířené vyhledávání pomocí operátorů a podmínek. Důležité je taky adekvátní volba příslušného vyhledávače. Nevýhoda Google nebo třeba Binu spočívá v tom, že sdružují obrovské množství výsledků, které mohou být ve finále kontraproduktivní. Navíc existují vyhledávače, které se specializují pouze na vyhledávání na určitém území (Rusko-Yandex, Asie-Baidu, Yamli-arabský svět). Zvláštním případem je pak vyhledávač DuckDuckGo, který poskytuje homogenní vyhledávání pro všechny uživatele bez ohledu na umístění či historii vyhledávání. Skrz vyhledávače pak používáme různé webové stránky, jejichž primární účel není OSINT, nicméně ho umožňují. V souvislosti se strategy consultigem jde typicky o stránky jako opencorporates.com (umožňující globální přístup k firemním finančním výkazům), databáze Passport (obsahující zdroje o trzích), statistický portál Statista (jeden z největších poskytovatelů tržních dat na světě) a další.

Open Government Data

Jedním ze zdrojů veřejně dostupných dat, které mohou konzultanti pro své účely využívat jsou tzv. Open Government Data. Dnes jsou vlády považovány za největší tvůrce dat na světě. K roku 2020 data pravidelně zveřejňovalo přes 80 vlád na světě z různých sektorů (vzdělání, težební průmysl, zdravotnictví). V ČR je příkladem takovýchto dat např. databáze na Českém statistickém úřadě nebo portál justice.cz. Výhodou těchto dat je, že byli shromážděny na náklady daňových poplatníků, a tak jsou následně vládními institucemi poskytovány většinou již zdarma. Pokud konzultanti vědí, jak správně dostupná data uchopit a kde je najít, dokáží z nich vytěžit cenné informace. Význam OGD stoupá také zejména z důvodu častějšího působení firem na zahraničních trzích, pro provedení úspěšného vstupu na trh jsou předběžné analýzy klíčové. Zvyšuje se tak důležitost vstupních a konkurenčních studií, pro které mohou často poskytnout relevantní informace pouze OGD (Gottfried et al., 2021).

Fingerprinting Organizations with Collected Archives (FOCA)

FOCA je je open-source software, který umožňuje extrakci analýzu metadat, která v sobě ukrývají elektronické dokumenty (Word, Excel, PDF, SVG atd.), FOCA extrahuje skryté informace ze souborů a zpracovává je tak, aby uživateli ukázala relevantní aspekty. Informace, které tímto způsobem může získat ze souborů jsou např. místa, kde byly dokumenty vytvořeny, použité operační systémy, emailové adresy uživatelů souborů, datum vytvoření atd. Alternativou k FOCA může být také poměrně rozšířený nástroj jménem Metagoofil. Tento způsob provádění CI by měl být však více dohlížen z etických důvodů.

SOCMINT

Zkratka SOCMINT znamená Social Media Intelligence a jde o zpravodajství ze sociálních sítí. Vzhledem k digitální době, ve které dnes žijeme, se i sociální sítě staly relevantním zdrojem informací, ze kterého lze čerpat. Sociální sítě lze např. použít k analýze cílového publika, monitorování aktivit konkurence nebo nových trendů. Ačkoliv data ze sociálních sítí nebývají primární zdroj pro definitivní rozhodnutí ve firmách, mohou konzultantům kupříkladu posloužit jako opěrný bod při argumentaci s klientem ohledně navrhovaných změn do budoucna.  

Velké jazykové modely

Velké jazykové modely jsou s příchodem boomu AI nedílnou součástí většiny velkých mezinárodních firem. Modely od firem jako Open AI nebo Mistral AI se tak staly každodenní pracovní složkou velkého množství zaměstnanců. Výhody používání LLM na úrovni jednotlivce (překlad, sumarizace textu, generování textu, psaní kódu) jsou poměrně jednoznačné a srozumitelné. Pokud bychom chtěli ale zagregovat použití LLM na vedení projektu, mohou se objevit nejasnosti jak na správné použití.

Práce strategy konzultantů lze dle Mohan (2024) rozdělit do 5 základních fází: input fáze, dignostika problémů, návrh opatření, implementace a output fáze. Mohan popisuje možný příspěvek LLM v následujících činnostech.

  • Input fáze – LLM by mohl vytvořit předběžnou analýzu řešeného problému
  • Diagnostika problému – V této fázi by LLM pomáhal se zpracováním datové analytiky za účelem diagnostiky.
  • Návrh opatření – LLM by se na základě dat pokoušel namodelovat možná řešení a s připomínkami klientů by je dále rozvíjel.
  • Implementace – Pomáhal by zavádět novou praxi do firemních struktur.
  • Output fáze – Vytvořil by finální report pro klienty.

Alternativou k používání běžných LLM na trhu může být používání vlastního upraveného LLM. Firmy mají v případě používání kustomizovaného jazykového modelu v zásadě dvě možnosti. První je velmi nákladný vlastní vývoj, který zahrnuje trénování a modelování dat, tvorbu rozhraní a integraci do softwarových systémů firmy. Druhou variantou je pak levnější hostování existujícího modelu, který lze např. natrénovat na interní data (Bratić et al., 2024).

Jazykové modely jsou nicméně poradenským prostředím obecně vnímány jako dvousečná zbraň. Na jedné straně při správné implementaci zvyšují efektivitu a šetří peníze. Na stranu druhou relativizují největší hodnotu, které poradenské společnosti mají, a to jsou znalosti zaměstnanců z projektů. Řada konzultačních společností z tohoto důvodu v nedávné minulosti koupilo technologické firmy zabývající se LLM a AI. McKinsey koupilo firmu QuantumBlack, Deloitte firmu SFL Scientific’s Business, BCG firmu Gamma a Accenture japonskou firmu ALBERT (Oaure-Itseuwa, 2024).

Competitive Landscape Analysis

Competitive Landscape Analysis (Analýza konkurenčního prostředí) je nepřetržitý proces zkoumání a vyhodnocování konkurenčních služeb/produktů na trhu za účelem pochopení jejich obchodního cíle (Maduranga, 2024).

Konzultanti se běžně setkávají s požadavky na analýzu konkurenčního prostředí. Firmy si totiž stále více uvědomují význam konkurenční výhody pro naplnění svých dlouhodobých cílů a na konzultanty se obracejí s prosbou, jak tuto výhodu odhalit a případně využít ve svůj prospěch.

Jedním z velice rozšířených nástrojů konkurenční analýzy je Porterův model pěti sil, který seskupuje do pěti skupin nejdůležitější faktory ovlivňující stav trhu a konkurence. Konkrétně zachycuje intenzitu konkurence, hrozbu potenciální konkurence, hrozbu substituce klíčového zboží a vliv kupujících a dodavatelů. Porterův model umožňuje identifikovat příčiny konkurence mezi firmami působícími v odvětví, analyzovat stav trhu v odvětví a zkoumat perspektivy jeho dalšího vývoje. Tyto poznatky lze využít v procesu formulování budoucích strategií nebo např. k odhadu míry návratnosti investice (Kostestska, 2022).

Data mining v Competitive Intelligence

Data mining je analýza nashromážděných dat, která má za cíl nalézt skryté vztahy mezi daty a popsat je tak, aby byla srozumitelná a použitelná pro toho, kdo analýzu provádí (Hand et al., 2001).

Data mining praktiky bývají často nedílenou součástí dobře zavedeného CI ve firmách, jelikož se vzájemně doplňují.  Pomocí CI praktik jsem schopný nashromáždit data v potřebné kvalitně. Následně je však musím být schopný zanalyzovat, což se často provádí za pomocí data miningu.

V souvislosti s prací konzultantů mám na mysli zejména text mining a web mining. Pomocí OSINT nástrojů můžete nalézt např. užitečné soubory či stránky relevantní pro váš projekt, ty však mohou obsahovat obrovské množství textu a dat. V momentě, kdy by se do analýzy takových souborů pustil člověk, mohla by se snadno vymazat výhoda (čas, efektivita), kterou získal pomocí OSINT nástrojů.

Dle Gupta (2024) je text mining objevování nových, dříve neznámých informací pomocí extrakce z různých textových zdrojů. Následující kroky jsou nezbytné pro provedení text miningu.

  • Kolekce dat
  • Úprava dat – Aby analýza proběhla v pořádku je potřeba nastavit tzv. ignorování stop-slov. Typicky jde o spojky a předložky, které nenesou žádné informace o obsahu textu. Následně je potřeba určit kmenová slova, na základě kterých se bude řídit vyhledávací algortimus.

V text miningu existují dva základní typy úloh. První je vyhledávání informací (information retrieval), která se zaměřuje na získání dokumentů či dat z velkých databází. Druhá je extrakce informací (information extraction), která se už vyloženě zaměřuje na získávání specifických informací z textových dat.

Web mining je dle Hayath a Komarasamy (2022) proces, jenž pomáhá analyzovat a interpretovat velké objemy zdrojových dat z webu. Berka (2003) uvádí pět základních funkcí web miningu.

  • Získávání znalostí, které jsou ukryté na stránkách
  • Vyhledávání a metavyhledávání – Vyhledávání stránek relevantních k dotazu uživatele.
  • Kategorizace dokumentů – Shlukování stránek dle obsahu.
  • Klasifikace dokumentů – Filtrování stránek relevantních vzhledem k uživatelově profilu.

Pokud bychom chtěli ve firmě opravdu efektivně využívat text mining a web mining, je nezbytné pořídit licence na programy jako například Intelligent Miner for Text od IBM nebo Oracle Data Mining. Nicméně triviálnější úlohy se dají vyřešit například pomocí volně dostupného softwaru RapidMiner nebo BigLM. Google Analytics si také do jisté míry zvládne poradit s web/text miningem.

Použití nástrojů CI vůči konkurenci

Doposud byla esej psána pouze z pohledu konzultantů a toho, jaké nástroje mohou případně používat v rámci CI. V následujícím odstavci bych se rád zaměřil na samotné konzultační firmy a jak mohou ony využít CI ve svůj prospěch.

Konkurence na trhu se strategy konzultačními firmami je velmi vysoká. Pokud se podíváme na portfolio služeb, které firmy v rámci např. českého trhu nabízí, dojdeme k závěru, že služby se na první pohled příliš neliší. Nelze si pochopitelně pro exaktní porovnání obstarat veškeré potřebné materiály, které by nám umožnily porovnat kvalitu nabízených služeb a lidského kapitálu, nicméně témata a odvětví, kterým se tyto poradenské firmy věnují, jsou v zásadě stejné. Jedná se nejčastěji o finance, provoz, digitální transformace a udržitelnost.

Konkurenci na poli strategických konzultačních společností zvyšuje i zvětšující se přítomnost technologických firem v poradenském odvětví. Tyto společnosti mají obvykle navrch v oblasti poradenských služeb, které jsou založené na AI a lze předpokládat, že na základě tohoto můžou být v budoucnu rovnocenným konkurentem desítky let zavedeným firmám.

Prinsloo (2017) identifikuje následující konsekvence, které může mít správně nastavené CI ve firmě.

  • Komplexnější přehled o činnosti konkurence.
    • Identifikace silných a slabých stránek konkurence.
    • Identifikace personálního potenciálu konkurence.
  • Větší znalost trhu, na kterém se firma pohybuje.
  • Predikování budoucích vývojů a potenciálních hrozeb.

Prinsloo (2017) dále uvádí několik kroků, které by měly pomoci naplno integrovat CI politiku do společností

  • Vytvoření centrálního integračního místa (oddělení), které bude mít vlastní pracovníky a lidi zodpovědné za koordinaci CI ve společnosti. Toto oddělení by mělo neustále zvyšovat povědomí o CI mezi zaměstnanci a vyšším managementem a nabízet relevantní školení.
  • Zároveň by měly být stanovena jednoznačná etická pravidla ohledně používání CI zaměstnanci.
  • Doporučováno je také partnerství v rámci CI s veřejnou institucí nebo akademickou obcí.

Firmy, kterým se povede zavést prvky CI do svého každodenního fungování pak mohou dále zvyšovat úroveň CI například formou aplikování modelu SECI, který holisticky přistupuje k procesu tvorby znalostí.

Etika v CI

Dodržování etických způsobů provádění CI je zásadním aspektem, které firmy musí dodržovat a monitorovat. Udržování konkurenceschopnosti je pro firmy zásadní, nicméně nikdy by tato snaha neměla narušovat etické chování. Firemní špionáž a korupce bohužel nejsou ve světe businessu ničím novým.

Podle Watch my competitor (2024) vývoj etického rámce Competetive Intelligence lze vybudovat na následujících krocích.

  • Tvorba interní politiky pro užívání CI – Formulace jasných zásad pro dodržování etického CI.
  • Pravidelná školení – Provádění pravidelných školení ohledně etických zásad užívání CI nástrojů.
  • Dohled – Zavedení monitorovacího systému, který zajistí dodržování pokynů.
  • Pravidelné revize – Pravidelné přezkumy aktuálních pravidel s ohledem na vývoj v odvětví a změnu zákonů.

Jedním takovým příkladem, kde etické kodexy dodržovány nebyly, je firma Deloitte, která v letech 2005-2010 vytvořila divizi s názvem Deloitte Intelligence. Součástí této divize byl i tým, který se ze značné části skládal z bývalých zpravodajců a pracovníků tajných služeb USA. Jejich cílem bylo špehovat konkurenty jako EY, PwC a KPMG. Tento tým stojí také za tím, že v roce 2009 Deloitte odkoupil velmi výhodně část konkurenční konzultační firmy BearingPoint, která se věnovala poradenství pro federální vládu. Deloitte měl velký zájem o toto odvětí, jelikož v něm tehdy oproti konkurenci zaostával. Žádný zaměstnanec Deloittu nebyl nikdy v souvislosti s těmito věcmi zmíněnými výše potrestán, nicméně kolem roku 2015 se začali objevovat bývalý zaměstnanci Deloittu, kteří o této kauze začali anonymně informovali média. To už byl ale Deloitte jednička na poli s poskytováním poradenských služeb vládě (CNBC).

Budoucnost CI v consultingu

S ohledem na aktuální trendy a stále zvyšující se roli umělé inteligence lze předpokládat, že do budoucna se CI bude ubírat směrem zvýšené automatizace procesů sběrů dat. Některé CI nástroje možná budou muset projít nějakými úpravami, aby lépe pracovali se stále populárnějšími koncepty, např. big data.

S ohledem na očekávaný větší objem a komplexnost dat, bude také úměrně růst požadavek na analytické schopnosti konzultantů používající CI. Bude kladen větší důraz na správné porozumění datům a jejich převedení na přidanou informační hodnotu, která může pomoct klientům.

Lze se také domnívat, že s nástupem AI se zvýšilo i podvědomí o CI a firmy do něj v budoucích letech budou investovat více než v minulosti. To podporuje i fakt, že se velké množství business modelů přesouvá k modelu rozhodování, který je založen na datech. Competetive intelligence by v těchto případech mohla hrát roli spojovacího článku, který z informací vytvoří vhled, který následně podpoří rozhodovací proces.

Obecně lze také tvrdit, že doposud byl zaměstnanec nejdražší nákladovou položkou v účetnictví konzultačních firem (Lafitte, 2022). Do budoucna je možné očekávat značný přesun prostředků na náklady, které budou spojeny s umělou inteligencí, datovou analytikou a snad i CI. Nicméně navzdory velkému technologickému pokroku v posledních letech, člověk a jeho schopnost porozumět kontextu a strategickým potřebám bude stále klíčovým prvkem úspěšného projektu.

Seznam použité literatury

PRINSLOO, Yolandi, 2017. Competitive intelligence in a multinational consulting engineering company: A case study. Mousaion [online]. 34(4), 81–107. ISSN 00272639. Dostupné z: doi:10.25159/0027-2639/2162

BRATIĆ, Diana, Marko ŠAPINA, Denis JUREČIĆ a Jana ŽILJAK GRŠIĆ, 2024. Centralized Database Access: Transformer Framework and LLM/Chatbot Integration-Based Hybrid Model. Applied System Innovation [online]. 7(1), 17. ISSN 2571-5577. Dostupné z: doi:10.3390/asi7010017

CALOF, Jonathan, Rubén ARCOS a Nisha SEWDASS, 2018. Competitive intelligence practices of European firms. Technology Analysis & Strategic Management [online]. 30(6), 658–671. ISSN 0953-7325, 1465-3990. Dostupné z: doi:10.1080/09537325.2017.1337890

GOTTFRIED, Anne, Caroline HARTMANN a Donald YATES, 2021. Mining Open Government Data for Business Intelligence Using Data Visualization: A Two-Industry Case Study. Journal of Theoretical and Applied Electronic Commerce Research [online]. 16(4), 1042–1065. ISSN 0718-1876. Dostupné z: doi:10.3390/jtaer16040059

GUPTA, Subhash Chandra a Noopur GOYAL, 2024. TEXT MINING: TECHNIQUES, APPLICATIONS AND ISSUES. In: Computing for Sustainable Innovation: Shaping Tomorrow’s World: International Journal of Innovative Research in Computer Science and Technology (IJIRCST) [online]. B.m.: Innovative Research Publication, s. 283–289 [vid. 2024-05-30]. Dostupné z: doi:10.55524/CSISTW.2024.12.1.49

KOSTETSKA, Nataliia, 2022. M. PORTER’S FIVE FORCES MODEL AS A TOOL FOR INDUSTRIAL MARKETS ANALYSIS. INNOVATIVE ECONOMY [online]. (4), 131–135. ISSN 2310-4864, 2309-1533. Dostupné z: doi:10.37332/2309-1533.2022.4.18

LUȚAI, Raluca a Adina MIHĂESCU, 2023. COMPETITIVE INTELLIGENCE AND OPEN SOURCE INTELLIGENCE – USEFUL TOOLS FOR COMPETITIVE BUSINESS. BULLETIN OF „CAROL I“ NATIONAL DEFENCE UNIVERSITY [online]. 11(4), 61–68. ISSN 2284-9378, 2284-936X. Dostupné z: doi:10.53477/2284-9378-22-95

HAYATH a Dr KOMARASAMY, 2022. Web Mining and Business Intelligence: A Key Factor for Success. TechnoareteTransactions on Intelligent Data Mining and Knowledge Discovery [online]. 2(4) [vid. 2024-05-30]. ISSN 2583195X. Dostupné z: doi:10.36647/TTIDMKD/02.04.A004

MOHAN, Sai Krishnan, 2024. Management Consulting in the Artificial Intelligence – LLM Era. Management Consulting Journal [online]. 7(1), 9–24. ISSN 2631-987X. Dostupné z: doi:10.2478/mcj-2024-0002

OARUE-ITSEUWA, Esioze, 2024. Artificial Intelligence’s Impact of the Management Consultancy Sector over the Next Five Years. Management Consulting Journal [online]. 7(1), 49–58. ISSN 2631-987X. Dostupné z: doi:10.2478/mcj-2024-0005

PASTOR-GALINDO, Javier, Pantaleone NESPOLI, Felix GOMEZ MARMOL a Gregorio MARTINEZ PEREZ, 2020. The Not Yet Exploited Goldmine of OSINT: Opportunities, Open Challenges and Future Trends. IEEE Access [online]. 8, 10282–10304. ISSN 2169-3536. Dostupné z: doi:10.1109/ACCESS.2020.2965257

WATCH MY COMPETITOR, 30. května 2024. Ethical Competetive Intelligence a guide. Online. Dostupé z: https://www.watchmycompetitor.com/resources/ethical-competitive-intelligence-a-complete-guide/ [cit. 2024-05-30].

CNBC, 30. května 2024. Accountants and spies: The secret history of Deloitte’s espionage practice. Online. Dostupé z: https://www.cnbc.com/2016/12/19/accountants-and-spies-the-secret-history-of-deloittes-espionage-practice.html [cit. 2024-05-30].

CONSULTING QUEST, 30. května 2024. Consulting fees and rates. Online. Dostupé z: https://consultingquest.com/podcasts_smcs/consulting-fees-and-rates/#:~:text=A%20cost%20structure%20is%20a,Firm%2C%20regardless%20of%2 [cit. 2024-05-30].

HAND, David J., Heikki MANNILA a Padhraic SMYTH, 2001. Principles of data mining. Cambridge, Mass: Bradford book MIT Press. Adaptive computation and machine learning. ISBN 978-0-262-08290-7.

BERKA, Petr, 2003. Dobývání znalostí z databází. Vyd. 1. Praha: Academia. ISBN 978-80-200-1062-9.


[1] Subkapitoly 3.1, 3.3 a 3.4 jsou zpracovány ze zdroje Pastor-Galindo et al. (2020)

VesselFinder: 729 000 lodí na mapě světa v reálném čase, jejich databáze, cesty a přístavy

0

V posledních letech se lodní doprava vrátila do středu pozornosti a znovu se začala vracet ke svojí dřívější slávě. Během pandemie COVID-19 došlo k dramatickému posunu v preferovaných dopravních metodách, lodní doprava se tak vyšplhala vzhůru a převzala část trhu, kterou dříve ovládala letecká doprava. Tento nárůst lodi jako preferovaného způsobu přepravy byl ovlivněn několika faktory, jako bylo omezení leteckých tras, masivní nárůst počtu nákladů a zvýšená ekonomická efektivita lodních přeprav. I přesto, že lodní přeprava trvá déle než doprava letadlem a může být méně spolehlivá, získala během pandemie velké množství nových zákazníků, což jí pomohlo udržet si svou pozici i poté, co se omezení letecké dopravy uvolnila.

Jak už název napovídá stránka VesselFinder funguje obdobně jako Flightradar24, Plane Finder nebo MarineTraffic. Je to klíčový nástroj pro všechny, kdo se zajímají o námořní dopravu, protože umožňuje sledovat lodě v reálném čase po celém světě. Otevírá dveře k monitorování, lokalizaci a získávání informací o lodích, ať už se plaví po oceánech, plují po řekách nebo kotví v přístavech.

VesselFinder spojuje nejmodernější technologie, včetně satelitního sledování a široké škály datových zdrojů, aby uživatelům poskytl aktuální polohu lodí. Ale není to jen o mapování – umožňuje také detailní pohled na plánované trasy, rychlosti, směry plavby a další klíčové údaje. Tato platforma je k dispozici ve 12 světových jazycích a její využití se rozšířilo napříč různými odvětvími. Od logistiky a obchodního průmyslu až po rybolov a zvědavé jednotlivce sledující pohyb lodí kvůli balíčku nebo prostě ze zvědavosti, jak se vyvíjí světový námořní provoz.

VesselFinder tedy představuje velice mocný nástroj, který může sloužit jak jednotlivcům, tak korporacím. V placené verzi je mnoho funkcionalit, jejichž využití může mít pozitivní dopad na podnik, jako například historické záznamy lokací a detailů lodí, plánování a orientační ceníky pro lodní dopravu nebo sledování vybraného kontejneru místo celé lodi. To vše s faktem, že je VesselFinder dostupný i v podobě mobilní aplikace, může mít každý informace o lodní dopravě doslova v kapse. Umožňuje sledovat a analyzovat námořní dopravu, což je klíčový prvek pro efektivní řízení logistiky a obchodních operací, a to v reálném čase. Jeho význam v oblasti námořní dopravy neustále roste a poskytuje komplexní informační zdroj pro uživatele na celém světě.

Seznam osmi funkcí rozdělený na placenou a neplacenou verzi
Obrázek 1 Verze nástroje [zdroj obrázku: autor]

Aktuální mapa lodí

Hlavním tahákem VesselFinderu je jeho živá mapa, která okamžitě ukazuje, kde se momentálně nacházejí všechna plavidla na vodní hladině. Aby byla tato mapa co nejpřesnější, VesselFinder využívá několik metod. Začněme Terrestrial AIS (T-AIS), což je standardní systém pro komunikaci mezi loděmi.

Mapa světa s šipkami označujícími loděmi
Obrázek 2 Mapa lodí [zdroj obrázku: autor]

Tento systém je původně určen pro samotné lodě, aby získaly širší přehled o ostatních plavidlech v okolí a přesněji určily jejich polohu. To všechno je pro zvýšení bezpečnosti, minimalizaci rizika kolizí v podmínkách omezené viditelnosti a prevenci nehod. Dodatečné sledování polohy pak zajišťují satelity, které doplňují informace na VesselFinderu a sledují pohyb z výšky. Tímto způsobem slouží jako sekundární zdroj dat. Uživatel si dokonce může tuto funkci v menu zapnout nebo vypnout, a tím získat pouze informace potvrzené systémem T-AIS. Nedostatek T-AIS je ale při pohybu lodi ve velké vzdálenosti od pevniny, kdy klesá přesnost určení polohy. Proto je kombinace T-AIS a S-AIS důležitým faktorem pro funkčnost nástroje. Polohy plavidel jsou pravidelně aktualizovány každých několik minut. Samotný VesselFinder uvádí, že informace o poloze lodí se obvykle aktualizují s latencí od několika minut až po hodiny. Když najedeme na určité plavidlo, okamžitě vidíme, kdy byla jeho poloha naposledy zaznamenána.

Filtr, výběr lodí podle typu (rybářská, vojenská,...)
Obrázek 3 Filtr [zdroj obrázku: autor]

Původně tento systém slouží přímo plavidlům, aby se zajistil široký přehled o ostatních plavidlech poblíž a k přesnějšímu určení polohy. To má zajistit zvýšení bezpečnosti, minimalizování nebezpečných situací při snížených viditelnostních podmínkách a prevence srážek plavidel. Druhou složkou tohoto sledování polohy jsou satelity, které na VesselFinder doplňují informace pozorováním výšky a slouží tedy spíš jako sekundární zdroj dat. Nejspíš proto ho lze zapnout i vypnout v menu. Poloha plavidel se pravidelné obnovuje po několika minutách. VesselFinder sám uvádí, že k přesná poloha lodi je aktualizována s latencí minuty až hodiny. Při najetí na plavidlo se nám okamžitě zobrazí, kdy byla poloha zaznamenána.

Lodě se dají lehce filtrovat. Pro základní neplacenou verzi je dostupné pouze filtrování pomocí typu lodi, ty se děli na několik skupin, mezi nimiž můžeme najít rybářské lodě, tankery, jachty nebo dokonce vojenské lodě. Mezi filtry dostupné pouze pro prémiové uživatele, najdeme například vlajku, cíl cesty, poslední navštívený přístav nebo dokonce váhu.

Zajímavou funkcí pro prémiovou verzi VesselFinder je Fleet mode (Režim flotily). V případě, že si VesselFinder platíme, můžeme si vybrat jen určité lodě. Například si vyberete pouze lodě, které patří vašemu podniku. Nebo si vyberete, na kterých se převáží váš náklad. Tímto způsobem si můžete vybrat až deset lodí, přidat je do flotily, a mít jednoduchý přehled o tom, kde se na mapě právě nachází.

Je také možné rychle a jednoduše zapnout Density map, která nám zobrazí kde se nejčastěji na mapě vyskytují lodě, a to i s ohledem na minulost. Tím nám vlastně zobrazí lodní trasy. Tyto trasy je v prémiové verzi možné dále filtrovat podle nákladu či typu lodi.

Heat mapa lodních cest
Obrázek 4 Density map [zdroj obrázku: autor]

Kdykoli si pak kteroukoli loď na mapě můžeme rozkliknout a získat podrobné informace o lodi. V detailu se můžeme podívat na informace jako je rychlost, kurz, status, počasí v místě, ve kterém se právě loď nachází a další.

Detaily o lodi a mapa s polohou lodi
Obrázek 5 Detail lodi [zdroj obrázku: autor]

Databáze lodí a přístavů

VesselFinder ale není pouze aktuální mapa lodí a přístavů. Je to i jejich databáze. Při otevření databáze hned můžeme vidět, že VesselFinder udržuje přehled o skoro 729 000 lodích. V tomto seznamu najdeme různé lodě, od těch patnácti metrových, až po ty skoro pětiset metrové. Navíc si je můžeme vyfiltrovat podle údajů, stejných jako na aktuální mapě. Většina lodí zde má i vlastní foto, těch je v databázi dokonce přes milion. Podobným způsobem jsou v databázi i přístavy, u kterých je nejen v jakém státě se nachází a jak se jmenují, ale i jejich kód využívaný pro lodní dopravu. Přehled o počasí v místě přístavu je už jen taková třešnička na pomyslném dortu. VesselFinder tak poskytuje ucelený přehled o všech objektech, které zobrazuje na Aktuální mapě.

Databáze lodí
Obrázek 6 Databáze lodí [zdroj obrázku: autor]

Další funkce

VesselFinder obsahuje i několik dalších funkcí, které mohou být použity okrajově, ale mají svůj význam. Jednou z nich je přehledná sekce se zprávami ze světa lodní dopravy. Kromě očekávaných témat, jako jsou zprávy o nehodách a finančních událostech, obsahuje i sekci věnovanou pirátství. Tato sekce poskytuje informace o unesených lodích a snahách o potlačení moderního pirátství, což je zajímavý a důležitý prvek v kontextu současných výzev v námořní dopravě.

Možnost sledovat konkrétní kontejner je jedním z těch atraktivních prvků, které dokáží zaujmout malé i velké společnosti. I když je tato funkce dostupná pouze v placené verzi, stránka alespoň nabízí náhled toho, jak takové sledování funguje. Vedle mapy obsahuje tato funkce plán plavby kontejneru od jeho nalodění přes všechny události, které již proběhly, až po plánované doručení, poskytující tak komplexní přehled o každém kroku přepravy

Pro registrované uživatele je k dispozici funkce plánování plavby. Stačí zadat výchozí a cílový přístav, odhadovanou průměrnou rychlost lodi, a získáme plánovanou trasu, kterou loď může plout, podobně jako když si v mobilní mapě naplánujete trasu k nejbližší kavárně, získáte informace o plánované cestě, včetně vzdálenosti a doby trvání trasy. Navíc, jak už bylo řečeno, v placené verzi tato funkce dává uživateli možnost si zobrazit přibližnou cenu, kterou může očekávat, pokud by se chtěl touto cestou plavit, či poslat nějakou zásilku.

Časový rozvrh doručení kontejneru rozdělený na části podle místa zpracování úkonu
Obrázek 7 Sledování kontejneru [zdroj obrázku: autor]

Výhody a nevýhody

VesselFinder není jediný nástroj na sledování lodí na jejich cestě. Další velice známy nástroj je MarineTraffic. Ale co z toho je lepší použít? Ke správnému rozhodnutí může sloužit tato část porovnání, protože každý nástroj, je lepší v něčem jiném.

VesselFinder
Výhody:
Uživatelské rozhraní: Nabízí přehledné a intuitivní uživatelské rozhraní, které usnadňuje navigaci a použití.Zobrazení informací: Poskytuje široké spektrum informací o lodích, včetně jejich polohy, rychlosti, plánované trasy a dalších technických údajů.Přesnost dat: Je známý pro svou přesnost dat a spolehlivost informací poskytovaných uživatelům.
Nevýhody:
Cena: Může být nákladnější než jiné služby pro uživatele, kteří hledají levnější možnosti sledování lodí.Omezená zdarma verze: Může mít omezené možnosti pro uživatele, kteří využívají bezplatnou verzi aplikace.
MarineTraffic
Výhody:
Rozsáhlá síť uživatelů: Má velkou uživatelskou základnu a komunitu, což může poskytnout rozšířené informace a komunitní zpětnou vazbu.Více funkcí v bezplatné verzi: Může nabídnout širší spektrum funkcí a informací v rámci bezplatné verze.
Nevýhody:
Komplikované uživatelské rozhraní: Může být více složité na použití a navigaciMenší přesnost dat: Mohou se objevit nesrovnalosti ohledně přesnosti a spolehlivosti některých poskytovaných informací.

Závěr

Celkově je tedy VesselFinder je opravdu mocným nástrojem poskytujícím komplexní informace o námořní dopravě a otevírajícím uživatelům široké možnosti sledování a analýzy. Jeho význam v oblasti námořní dopravy neustále narůstá, což zvyšuje jeho hodnotu v konkurenceschopnosti firem, které ho využívají. Ať už slouží rybářským společnostem k efektivní koordinaci jejich rybářských bárek nebo mezinárodním firmám k plánování dodávek zboží a aktualizaci plánu na základě informací o nákladních lodích, VesselFinder se stává nedocenitelným partnerem pro efektivní řízení a optimalizaci procesů v oblasti námořní dopravy.

Zdroje

Seznam obrázků

  • Obrázek 1 Verze nástroje [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/]
  • Obrázek 2 Mapa lodí [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/]
  • Obrázek 3 Filtr [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/]
  • Obrázek 4 Density map [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/]
  • Obrázek 5 Detail lodi [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/]
  • Obrázek 6 Databáze lodí [zdroj obrázku: autor ze stránky https://www.vesselfinder.com/vessels]
  • Obrázek 7 Sledování kontejneru [zdroj obrázku: autor https://container.vesselfinder.com/]

Eltis.org: Udržitelná doprava napříč evropskými městy ve 20. století

0
a blurry photo of a person walking in front of a train

Doprava je ve veřejném prostoru dlouhodobě jednou z nejčastěji probíraných oblastí. Její význam zejména v kontextu městské hromadné dopravy a urbanismu je nepopiratelný a nabízí i potenciál dalšího růstu. Fungující a udržitelná doprava je potřebná jak k tomu, aby se rodina mohla dostat v pořádku a dostatečně rychle večer domů, tak k tomu, aby správným způsobem fungovala celá ekonomika. I s ohledem na důležitost ochrany životního prostředí a udržitelnosti v dnešní době je pak nutné získat k tématu dopravy i kvalitní informační zdroje, a právě eltis může plnit roli jednoho z nich.

Přehled a obecné informace

Eltis je webový portál určený k výměně a sdílení informací o dopravě v evropských městech. Nezisková iniciativa, pod kterou portál spadá, byla vytvořena Evropskou komisí, konkrétně generálním ředitelstvím pro energetiku a dopravu. Zaměřuje se zejména na udržitelnost dopravy a v současnosti se dá označit za jeden z důležitých informačních zdrojů k dané tématice.

Samotný portál již existuje více než 20 let a soustředí se právě na poskytování informací, nástrojů, zkušeností, ale i třeba komunikačních kanálů. Všechny tyto věci mohou následně jednotlivé obce využívat k tomu, aby se v oblasti udržitelné dopravy mohly vyvíjet a dosahovat konkrétních cílů. Financování ze zdrojů Evropské unie pak dodává nástroji určitou míru kredibility, která se odráží dle mého názoru například i ve vizuálním zpracování portálu. Samotná platforma pak pod záložkou links propaguje i další portály zaměřené na podobnou problematiku, což signalizuje již zmíněnou vysokou kredibilitu a skutečný důraz na význam udržitelné dopravy v moderním, rychle se měnícím, světě.

Obrázek 1: Úvodní stránka eltis.org [zdroj obrázku: autor]

Obsah portálu

Webový portál a jeho obsah se dá rozdělit do tří různých oblastí. První z oblastí (portálem označená jako “in brief”), můžeme ji dále označovat jako informační, se věnuje poskytování informací o dopravě, její udržitelnosti ve městech a příbuzným tématům. Představit si pod ní můžeme například sekci zaměřenou na novinky, statistická data, legislativu Evropské unie zaměřenou na problematiku dopravy, nebo měsíční newsletter.

Druhá oblast (portálem nazvaná jako “resources”) se zaměřuje na poskytnutí nástrojů a přímo využitelných zdrojů. Na první pohled se může zdát, že mezi oblastmi nepanují velké rozdíly, nicméně při bližším prozkoumání je můžeme poměrně snadno odhalit. V případě druhé oblasti se totiž jedná zejména o tipy na konkrétní nástroje a jejich seznamy, které mohou obce využít, fotografie a videa, díky kterým je možné vizualizovat reálná řešení, nebo tréninkové materiály a případové studie.

Poslední a zároveň také nejmenší z oblastí, kterou portál poskytuje, se věnuje zapojení návštěvníků (“participate”). Tato sekce v sobě obsahuje možnost stát se tzv. přítelem portálu eltis, což návštěvníka opravňuje k využití dalších, poměrně rozličných, funkcí a benefitů. Mimo to eltis spravuje kalendář s význačnými akcemi a konferencemi, které se tématu dopravy týkají.

Obrázek 2: Sekce portálu eltis.org [zdroj obrázku: autor]

Právě pomocí těchto tří sekcí se dá poměrně pěkně popsat obsah portálu, ze kterého inherentně vyplývají i konkrétní případy možného využití. Struktura portálu je nicméně poměrně nově obohacena i o oblast čtvrtou, která se týká konkrétních plánů udržitelné mobility ve městech (Sustainable Urban Mobility Plans, dále jako SUMPS). Zde je možné nahlédnout do jednotlivých plánů v zapojených obcích, jejichž situace návštěvníka zajímá. Zároveň je zde velmi podrobně popsán proces tvorby SUMPS a konkrétní pokyny včetně glosáře a nástroje k hodnocení plánů. V základní struktuře portálu se pod těmito oblastmi objevují také čtyři různá pole, která jednoduchým způsobem zprostředkovávají návštěvníkovi aktuální témata, nejnovější články, nadcházející události a informace o COVID-19.

Vyhledávání článků na eltis.org

Vzhledem k tomu, že portál obsahuje informace v různých podobách (články, datové soubory atp.) je poměrně zajímavá i struktura vyhledávání a možnosti, ke kterým má uživatel v této oblasti přístup. Články, které tvoří jednu ze stěžejních částí portálu jsou při výchozím nastavení seřazeny klasicky chronologicky. Návštěvník portálu má nicméně možnost využít klasického vyhledávání, a to jak full-textového způsobu tak vyhledávání dle klíčových slov. Portál nabízí i pokročilé hledání, kde si lze upřesnit například zemi, které se článek týká, nebo téma článku dle předem definovaných kategorií.

U každého z článků je následně uváděn upřesněný region, kterého se týká, odkaz a podobné články, které by mohly návštěvníka zajímat. Uváděny jsou zde mimo jiné informace o čtenosti a články je možné sdílet pomocí prokliku na několika různých sociálních sítích. Při čtení některého z článků na portálu je zároveň proměněné i rozložení stránky, které vede k tomu, že návštěvník vidí v pravé části obrazovky sloupek s názvem spotlight, který nabízí moderovaný výběr z článků na webu, které mohou být právě aktuální.

Mezi další zajímavé funkce patří také rss feed a možnost podívat se na autora zmíněného článku. U profilů autorů pak lze pozorovat kromě místa bydliště a regionu i konkrétní zájmy nebo oblíbený obsah z portálu. Do jisté míry tak platforma může být využívána jako sociální síť, i když samozřejmě pouze velmi omezeně.

Obrázek 3: Články na portálu eltis.org a možnosti jejich vyhledávání [zdroj obrázku: autor]

Vyhledávání datových zdrojů, případových studií a dalších informací

U dalších zdrojů, které portál nabízí a které jsou již popsány výše, je nabídnuto vyhledávání v podobě, která vždy připomíná nějakým způsobem obohacené vyhledávání článků. Rozdíly lze typicky pozorovat u dodatečných filtrů, které nejsou u článků k dispozici (například jde zmínit hledání dle původů a efektů dat u datových zdrojů). Podobným způsobem jsou poskytovány i galerie obrázků a videí, mezi kterými jde také filtrovat poměrně snadno.

Doprava a plány udržitelné mobility

U SUMPS, jakožto u nejnovější sekce portálu, lze pozorovat různá zajímavá specifika, která zároveň obsahují poměrně atypické funkce. Materiály, které jsou portálem zprostředkovávány lze rozlišit dle různých metod. Návštěvník se může podívat na situaci v konkrétních zemích, které se do programu zapojují a stejně tak i na partnerské, do programu zapojené, společnosti. Nejzajímavější části je zde nicméně určitě databáze zapojených měst.

V databázi měst si návštěvník může projít situace v konkrétních městech, které jsou do programu zapojeny. Po vyfiltrování výsledků by měl dostat k dispozici přímo odkaz na SUMP daného města, který si může důkladně prostudovat. Samotné možnosti vyhledávání jsou zde poměrně široké, což je vítané zejména z důvodu poměrně vysokého počtu zapojených měst. Na přiložených obrázcích lze poté vidět i druhou možnost vyhledávání, kterou je interaktivní mapa.

Obrázek 4: Vyhledávání v databázi zapojených měst na portálu eltis.org [zdroj obrázku: autor]

Široké množství filtrů v sobě obsahuje nejprve položku „Urban Mobility Plan“. Tím si může uživatel vyfiltrovat pouze taková města, která nabízí plán k dispozici kompletně online a bez jakýchkoli dalších bariér. Pomocí okna „Inhabitants“ může návštěvník omezit selekci pouze na města s určitým počtem obyvatel. Zajímavé zde je využití dvou různých filtrů, které se odlišují tím, zdali do nich patří větší oblasti okolo samotných měst nebo ne. Kromě filtru na úrovni států pak ještě uživatel může využít konkrétní specifikace dle projektů Evropské komise, do kterých byla města zapojena.

Obrázek 5: Interaktivní mapa portálu eltis.org využitelná k hledání v databázi zapojených měst [zdroj obrázku: autor]

Případové studie

Zpřístupnění pestrého množství případových studií je jednou z nejzásadnějších funkcí, které portál nabízí. Význam zde tkví zejména v kompaktním uspořádání podkladů na jednom místě. Případové studie pak obsahují velké množství informací a dat včetně reálného využití na základě kterých pak mohou obce uzpůsobovat své jednání v oblasti využívání dopravní infrastruktury. Právě uspořádání zdrojů v podobě portálu jako eltis pak může městům pomoci.

Případové studie jsou navíc stěžejním článkem portálu pro tvorbu komunity, o což se eltis dlouhodobě snaží. Uživatelé mají možnost přispět do databáze s vlastními případovými studiemi (samozřejmě je nutné projít schvalovacím procesem) a rozproudit debatu o jejich správnosti či významu pomocí komentářů. Portál nabízí několik kategorií, do kterých jednotlivé případové studie spadají, jejich výčet je pak ukázán níže.

  • Cyklistika
  • Čistá a energeticky efektivní doprava
  • Management dopravního provozu
  • Flexibilní dopravní služby
  • Nacenění a management poptávky po dopravních službách
  • Organizace dopravy a integrace služeb
  • Povědomí o dopravě
  • Bezpečnost
  • Městská hromadná doprava
  • Chůze
  • Městská logistika
  • Doprava pro lidi se sníženou mobilitou
  • Doprava a územní plánování

Pro ilustraci toho, jak vypadá obsah, který je portálem poskytován dále neuškodí podívat se na to, jak vypadají jednotlivé případové studie konkrétně. Mezi jedny z nejzajímavějších, na které webový portál odkazuje, lze zařadit například posouzení opatření v podobě snížení rychlostního limitu v konkrétních londýnských čtvrtích na 20 mil za hodinu, což je problematika, která lze vztáhnout v současnosti na velmi aktuální téma. Dále se může návštěvník dočíst například o transformaci nočních autobusových linek v Budapešti z roku 2005, při které došlo prakticky k instantnímu zdvojnásobení průměrného počtu cestujících při zachování velmi nízkých výdajů.

Obrázek 6: Ukázky případových studií z České republiky z roku 2015 na portálu eltis.org [zdroj obrázku: autor]

Realita a možnosti využití

Ohledně reálných možností toho, jak portál a informace, které se na něm nachází využít, by se dalo bavit velmi dlouho. Většina závěrů by šla nicméně zobecnit na využití konkrétními městskými úřady. Ty mohou díky těmto informacím vylepšovat a plánovat dopravní systémy a jejich strukturu. Zejména v oblasti MHD a udržitelné mobility nabízí eltis skutečně velmi zajímavou sbírku poměrně specifických informací.

Kromě toho může portál nabídnout i využití v soukromé sféře například při plánování větších developerských projektů. Těm může poskytnout informace o tom, jakým způsobem je ideální postupovat, a následně přinést třeba i benefity finanční v podobě navýšení hodnoty na základě často jednoduše proveditelných kroků.

Mezi konkrétní profese, které by portál definitivně měly znát, a kterým by mohl pomoci se může řadit například urbanista, který jej může využít k efektivnímu územnímu plánování. Stejně tak by o portálu měli mít povědomí ředitelé a zaměstnanci dopravních služeb měst či obcí či dopravních společností, kterým může pomoci při plánování spojů, respektive při snaze o úsporná opatření. Kromě toho své uplatnění portál určitě najde také u společností zabývajících se výrobou a vývojem dopravních prostředků (a to zejména v případě kdy společnost vyvíjí například autobusy nebo tramvaje). Těmto firmám portál nabízí možnost přizpůsobit svůj produkt aktuálním trendům ve veřejné dopravě, což může ve výsledků vést například i k nezanedbatelné konkurenční výhodě.

Při výčtu možností využití portálu by asi neměly být opomenuty akademické články, bakalářské, diplomové či další práce a výzkumy, u kterých může eltis sloužit jako ideální platforma k získávání dat. Zejména u různých srovnávacích studií pak můžou být jednotlivé nástroje klíčem k porozumění a správné interpretaci dat. Díky galerii fotek a videí pak může uživatel získat i vizuální podklady, dále použitelné v tvorbě zmiňovaných dokumentů.

Doprava a galerie fotografií na portálu eltis.org
Obrázek 7: Ukázka galerie fotografií na portálu eltis.org [zdroj obrázku: autor]

Open source jako cesta

Výběr informačního zdroje nebyl náhodný. Kromě možností vyhledávání, samotného tématu či pozoruhodné struktury je totiž zajímavá na portálu ještě jedna další důležitá věc, kterou je právě snaha o tvorbu určitě komunity a snaha o transparenci a zveřejňování informací. Velká část článků a vlastně celého obsahu je tvořena přímo uživateli portálu a ti jsou zároveň do jisté míry zodpovědní za jeho fungování.

Portál tak nabízí uživatelům a občanům Evropské unie možnost přispívat do veřejného prostoru v podobě internetu s informacemi třeba i o jejich rodném městě, které mohou být následně využity ku prospěchu nás všech. Možnost tvorby obsahu tak není omezená na úzké spektrum redaktorů, což je do jisté míry unikum, uvědomí -li si čtenář fakt, že je financován přímo ze zdrojů Evropské unie, a tudíž i členských států. Možná tak bude eltis kromě spolehlivých a kvalitně strukturovaných informací přispívat k fungování společnosti i jiným způsobem, a to přiblížením Evropské unie k samotným občanům a propagací toho, že otevřená data mohou být využívána i v případě států a nadnárodních entit.

Obrázek 8: Ukázka výsledku vyhledávání v databázi zapojených měst na portálu eltis.org – doprava a SUMP v Písku [zdroj obrázku: autor]

Závěr

Domnívám se, že portál eltis.org nabízí návštěvníkům unikátní možnost důkladně prozkoumat oblast veřejné dopravy v Evropě. Portál nabízí široké spektrum zdrojů, ze kterých lze dále čerpat, a mnohé filtry či funkce k jednoduššímu vyhledávání, které přispívají k snadné orientaci návštěvníka. Kromě toho je eltis velmi specifický svým postojem k budování komunity, což není u nástrojů či iniciativ z pera států či (jako je tomu v tomto případě) Evropské unie zvykem.

Právě zapojení členů a návštěvníků do procesu tvorby obsahu je totiž k fungování celého portálu klíčové. Pomocí odkazů na jednotlivé dokumenty je potom možné zjistit až nepřeberné množství informací, které můžou značně ulehčit práci jak obecním úřadům, tak velkým společnostem. Kromě toho pak webové rozhraní, i přes na první pohled nudný vizuál, nabízí velké množství nástrojů, které zaručí to, že bude návštěva zajímavá i pro do problematiky původně nezainteresovaného uživatele, kterým jsem vlastně byl v počátku i já.

Nástroj v podobě webové platformy přispívá zejména k porozumění v oblasti dopravy, přičemž se soustředí hlavně na její udržitelnost a větší územní celky v podobě měst. Působí zároveň jako archiv případových studií a článků, které se týkají daného tématu. Kromě toho využívá portál aktivní komunity k pořádání akcí a konferencí. Během pandemie COVID-19 byl pak aktivní i v šíření ověřených informací, týkajících se pandemie. Kromě samotné dopravy se často články a další materiály věnují i přidruženým oblastem.

Jako informační zdroj je portál spolehlivý a vzhledem k zřejmému napojení na Evropskou komisi a potažmo Evropskou unii nehrozí v blízké době konec jeho fungování. Data jsou uspořádána hierarchicky a orientace v portálu je velmi jednoduchá. Platforma tak ve výsledku působí jako studnice informací, která odpovídá tomu, co by člověk při přečtení jejího popisu očekával a zároveň přidává něco navíc.

Zdroje

[1] eltis.org – The Urban Mobility Observatory [online]. [cit. 6.12.2023]. Dostupné z: https://www.eltis.org