Současný stav a výhledy v oblasti vývoje centralizovaného katalogu informací veřejného sektoru ČR

PDF verze článku

Abstrakt

Článek po úvodu do problematiky opakovaného využití informací veřejného sektoru popisuje současný stav v oblasti existence katalogů informací veřejného sektoru v Evropské unii a České republice a představuje základní typologií těchto katalogů tak jak ji publikovala Evropská komise. Dále navrhuje možné fáze vývoje projektu jednotného českého katalogu informací veřejného sektoru a v závěru uvádí některé příklady a předpoklady skutečné realizace projektu.

Klíčová slova

veřejná správa, svobodný přístup k informacím, katalogy, informace veřejného sektoru, e-government

Abstract

Article introduces the topic of public sector information re-use and decribes current state-of-art in the area of public sector information catalogues in European Union and Czech Republic. It introduces the basic typology of such catalogues, based on the report of European Commission. It suggests possible phases of the project of unified catalogue of public sector information of Czech Republic and finally it shows some examples and conditions for the project’s real implementation.

Keywords

public sector information, public sector, free access to information, e-government, catalogues

Recenzenti:
PhDr. Jindra Planková, Ph.D.
Michal Rada

1 Úvod do problematiky

Informace veřejného sektoru (dále PSI1) jsou v současné době považovány za cennou surovinu, kterou je možné dále ekonomicky využít v rámci tzv. opakovaného využití („PSI re-use“). Obecně vznikají jako vedlejší produkt plnění zákonných úkolů veřejného sektoru a měly by tedy být dostupné k dalšímu využití všem zájemcům, z čehož následně profituje celá společnost.

Nutno poznamenat, že tato myšlenka je v Evropské unii (EU) poměrně nová a Evropská komise (EK) tomuto tématu věnuje pozornost zhruba od poloviny 90. let 20. století. Asi nejdůležitějším důvodem pro definování zcela nového přístupu k informacím veřejné správy byla v té době počínající masivní digitalizace PSI napříč členskými státy EU, která zcela změnila jejich dosavadní povahu – a to především z hlediska způsobů jejich v podstatě neomezeného dalšího využití. Evropská komise v tomto případě nemusela zcela vynalézat kolo a značně se inspirovala ve Spojených státech amerických, kde byla tato problematika řešena v podstatě již od druhé poloviny 60. let 20. století, kdy vznikl americký zákon o svobodném přístupu k informacím, pomalu se začínalo s digitalizací vládních dat a světlo světa spatřil předchůdce dnešní sítě Internet. Inspirace to byla ovšem především ideová a hlavně ekonomická, jelikož otevřenost a snadná zpracovatelnost vládních zdrojových dat byla jednou z mnoha příčin vyšší ekonomické výkonnosti USA ve srovnání s tehdejší EU2.

Z hlediska metodologie změny v Evropě zažitého paradigmatu, že státní informace by měly být veřejnosti přístupné jen zčásti (pokud vůbec), se jednalo a stále jedná o velice náročný úkol. V EU není na rozdíl od USA ani jednotný dorozumívací jazyk, ani jednotná infrastruktura veřejného sektoru, což samozřejmě téměř znemožňuje dosáhnout vytyčeného cíle. Proto Evropská komise začala v roce 1999 připravovat příslušné legislativní změny, které byly zhmotněny ve Směrnici EK č. 2003/98/EC o opakovaném využití informací veřejného sektoru3 (dále jen „Směrnice“) přijaté Evropským parlamentem v roce 2003, s povinností transpozice do právních řádů jednotlivých členských zemí do července 2005. Podrobněji se v tomto článku dokumentem zabývat nebudeme, ovšem důležité je, že členským státům ukládá pouze obecnou povinnost zpřístupnění informací veřejného sektoru a tedy neuvádí žádné konkrétní způsoby či formy, kterými je toho nutné dosáhnout.

Do českého právního systému byla směrnice transponována prostřednictvím zákona č. 106/1999 Sb., o svobodném přístupu k informacím4 (dále jen „Zákon“), což je v kontextu EU poněkud atypické; ostatní země vesměs pro tento účel přijaly buď zcela nové legislativní předpisy (např. Nizozemí), nebo vytvořily „druholigové“ předpisy (např. Spojené království či Irsko ve formě tzv. Statutory Instrument), popř. už podobnou právní úpravu přijaly před samotnou Směrnicí (Estonsko, Finsko). Podobně jako ČR transponovalo Směrnici do zákona o svobodném přístupu k informacím např. Norsko, na druhou stranu takové Lotyšsko transpozici využilo k vytvoření zcela nového zákona o svobodném přístupu k informacím, protože původně žádným obdobným předpisem jeho právní systém nedisponoval.5 Obecná zkušenost dnes ovšem ukazuje, že právě kombinace „ducha“ Směrnice se zákonem o svobodném přístupu k informacím v českých podmínkách značně usnadňuje přístup právě k těm informacím veřejného sektoru, které jsou vhodné pro opakované využití – Zákon v současné podobě téměř znemožňuje institucím veřejné správy surová data neposkytnout, což je pro českou společnost značně pozitivní a v méně prozíravých zemích EU nám dnes i trochu závidějí. Dodejme, že i přesto jsou některá data produkovaná českou veřejnou správou poněkud „zabetonovaná“ (např. kompletní export Obchodního rejstříku) z důvodu libovůle konkrétního správce, ovšem v případném soudním sporu dotaženém do konce (tedy k Nejvyššímu správnímu soudu) by případný žadatel nakonec uspěl. Zde je problém především v obecné tendenci české společnosti vyhýbat se jakýmkoliv soudním sporům, takže potřebná data si případní zájemci o jejich opakované využití nakonec opatří jinak – např. systematickým vytěžováním či dolováním dat6, na který mají potřebné prostředky. A co na to občan? Tomu to je většinou jedno a spokojí se s vyhledáváním jednotlivých záznamů pomocí webových rozhraní. Přičemž právě zde se nachází ohromný prostor pro inovativní řešení, které je možné aplikovat v jednotlivých členských státech v oblasti opakovaného využití informací veřejného sektoru, a zvýšit tak nejen jejich konkurenceschopnost, ale také vylepšit obecně kulturu a úroveň veřejné správy, neboť ona sama - jako producent celého universa nejrůznějších informací a dat - o nich nemá zdaleka ucelený přehled.

Typologie PSI

Pro lepší orientaci čtenářů v rámci této úvodní kapitoly stručně uvedeme situaci v oblasti obecné typologie informací veřejného sektoru, která není dosud normativně stanovena, a tak je možné na tuto oblast informačního universa nahlížet hned z několika hledisek.

Za asi nejzákladnější kritérium můžeme považovat rozlišení PSI na administrativní (informace vztahující se k veřejným institucím a jejich funkcím – např. informace o organizační struktuře, kompetencích, rozhodnutích apod.) a neadministrativní, což jsou informace „o vnějším světě“, které veřejná správa sbírá, shromažďuje a vyhodnocuje v rámci svých povinností, a tím vytváří informační obraz stavu okolního světa. Na takové informace je dále možné aplikovat obsahové hledisko, které je dnes nejpoužívanějším kritériem pro rozlišení PSI, ovšem jednotlivých obsahových kategorií je možné vytvořit značné množství, což přístup k informacím rozhodně neusnadňuje. Proto během posledních let vzniklo několik pokusů o sestavení závazné a systematické typologie dle obsahového hlediska – asi nejdůležitějším byl v daném kontextu projekt Evropské komise MEPSIR7 - v rámci závěrečných výstupů projektu byly informace veřejného sektoru rozděleny do šesti základních obsahových kategorií:

  • hospodářské informace,
  • geografické informace,
  • právní informace,
  • meteorologické informace,
  • dopravní informace.
  • sociální informace,

Toto vymezení samozřejmě nepokrývá celé spektrum PSI, např. OECD8 používá poněkud podrobnější typologii (včetně např. vědeckých informací či informací z oblasti kultury), ovšem pro běžné využití je toto dělení vhodné, právě i pro svou nekomplikovanost.

Tímto stručným úvodem do problematiky informací veřejného sektoru se dostáváme k tématu tohoto vydání časopisu ProInflow a tedy k otázce, proč je vlastně potřeba informace veřejného sektoru katalogizovat. Terénní výzkum provedený na ÚISK FF UK v rámci výběrového semináře „PSI – Informace veřejného sektoru“ v roce 20089 prokázal, že jednou z největších překážek rozvoje opakovaného využití informací veřejného sektoru je nedostatek relevantních metadat. Tím se jednou z nejdůležitějších komponent celého systému opakovaného využití informací veřejného sektoru stává tzv. Katalog informací veřejného sektoru, který ovšem nejen v ČR, ale ani ve většině ostatních členských států EU není zaveden, a to právě z důvodu obecného znění Směrnice, které podobnou iniciativu zřejmě předpokládá v členských státech automaticky. Realizace takového katalogu ovšem není nic snadného – PSI jsou velmi různorodé z hlediska obsahu i formy, často se mění v čase a jejich značná část je stále skryta na pevných discích pověřených úředníků, kteří jsou často jediné bytosti, které mají o jejich existenci tušení. Následující kapitoly se pokoušejí o analýzu současného stavu v rámci EU a ČR, a následně o hrubý náčrt možné koncepce českého katalogu informací veřejného sektoru.

2. Aktuální situace v oblasti informací veřejného sektoru v EU a ČR

Evropská unie

Kromě četných občanských a neziskových iniciativ je to především Evropská komise (EK), která v posledním desetiletí financuje síť ePSIplatform10 (dříve ePSI, resp. ePSI+), sdružující zainteresované osoby a instituce z veřejného, soukromého, akademického i neziskového sektoru. Obecným dlouhodobým cílem projektu je především monitoring situace ve členských zemích EU od doby přijetí Směrnice a vytváření ucelené tematické sítě expertů a znalostí z oblasti opakovaného využití informací veřejného sektoru. Prostřednictvím sítě, a do ní zapojených expertů ze soukromé, akademické a neziskové sféry, dochází mj. ke kultivaci veřejného sektoru a odpovědných osob ve smyslu přijmutí a osvojení vstřícného postoje k problematice opakovaného použití informací vyprodukovaných veřejnou správou.

V rámci iniciativy se dlouhodobě diskutuje i o rozvoji tzv. katalogů informací veřejného sektoru, které by v jednotlivých členských státech měly významně usnadnit orientaci v existujících informačních produktech (databázích, registrech apod.) veřejné správy a zároveň umožnit přístup potenciálním zájemcům ke „zdrojovým datům11“. Po zveřejnění Směrnice totiž nenásledovaly příslušné metodické dokumenty, který by rozsah či strukturu těchto katalogů jednoznačně definovaly. Podle španělské iniciativy Open Data @ CTIC už „skončila diskuse o smyslu budování katalogů PSI - nyní je aktuální otázka, jak je vytvořit.“ 12

V rámci tohoto článku není podrobněji rozebírán význam pojmu „katalog“, kterým v obecném slova smyslu rozumíme nejspíše účelně uspořádaný seznam různých entit se společným rysem. Důležitý je současný stav v oblasti - základní typologii evropských katalogů PSI zpracoval Davies v rámci své tematické zprávy o stavu rozvoje portálů pro informace veřejného sektoru.13

Davies rozdělil katalogy do těchto tří skupin:

  • Katalogy provozované subjektem veřejné správy – styl data.gov14 (umožňuje přímý přístup k datům)
  • Katalogy provozované subjektem veřejné správy – informační portály (žádný nebo limitovaný přístup k datům)
  • Katalogy provozované v rámci občanských iniciativ

Davies tímto rozdělením reflektoval existující realitu, proto v něm z teoretického hlediska chybí např. katalogy provozované soukromou společností; takové ovšem v EU v relevantní podobě v době zpracování zprávy neexistovaly.

První dvě skupiny katalogů PSI jsou provozovány na úrovni centrálních a regionálních vlád, popř. obecních samospráv. Nejvyspělejší kategorií jsou katalogy s možností přímého přístupu k širokému pásmu datových sad veřejné správy v elektronických formátech, které umožňují jejich opakované použití (XLS, XML, CSV, DBF apod.). Jako příklad je možné uvést především portál data.gov.uk, který provozuje vláda Velké Británie a k 1. 7. 2011 poskytoval možnost vyhledávání a přímého přístupu k více než 5400 datovým sadám veřejné správy Velké Británie15. Druhým typem katalogů, které jsou provozovány veřejnou správou, jsou informační portály, které nabízejí ucelenější přehled dostupných datových sad veřejné správy, ovšem v jejich rámci není možné data přímo stahovat. Příkladem může být např. dánský projekt Digitalisér.dk provozovaný centrální vládou.16

Počet podobných služeb není v současné době v zemích EU příliš vysoký - Davies uvádí cca 20 katalogů. To je do určité míry kompenzováno neziskovými projekty občanských iniciativ, uveďme např. slovenský projekt Datanest17 nezávislé iniciativy Aliancia Fair-play.

Česká republika

Opakované využití informací veřejného sektoru se v ČR řídí zákonem č. 106/1999 Sb., o svobodném přístupu k informacím. Ten byl i na evropské poměry přijat relativně brzy, takže transpozice Směrnice proběhla nikterak dramaticky. Obecně je možné konstatovat, že samotné zveřejňování informací veřejného sektoru je v ČR na velmi vysoké úrovni, ovšem důraz je stále kladen především na pouhé „zobrazování“ informací v rámci internetových aplikací, popř. dávkové stahování dat, což zdaleka nesplňuje náročné požadavky případného zájemce o kompletní zdrojová data.

Z hlediska tohoto článku je důležité, že dnes v ČR neexistuje oficiální úplný katalog informací veřejného sektoru, takže je často velice obtížné požadované datové sady vyhledat, nemluvě o podrobnějších metainformacích a přesných podmínkách dalšího využití (licence, poplatky apod.) Objem využitelných dat veřejné správy ČR bude vzhledem k rychlému rozvoji informační společnosti neustále přibývat, přičemž bez uspořádaných informací o jejich povaze a kvalitě bude jejich správa stále náročnější. Bylo by velice užitečné, kdyby povinné subjekty české veřejné správy měly určitou povinnost vést standardizovaný katalog (obsahující např. ceník, seznam, metainformace apod.), kde by byly jasně popsány základní atributy dat společně s náležitostmi jejich poskytnutí a opakovaného použití. Vyřešil by se tím současný problém, kdy dle zákona č. 106/1999 Sb. nemusí subjekty veřejné správy odpovídat na dotaz následujícího typu: Jaká data, v jaké kvalitě, v jakém formátu a za jakých podmínek poskytujete?

3 Nástin možností vývoje a podoby českého centralizovaného katalogu PSI

Na základě výše uvedených informací je možné nastínit možný scénář, na základě kterého by vznikl jednotný centralizovaný katalog informací veřejného sektoru ČR. Celý proces by mohl mít následující fáze:

1. fáze: Pilotní katalogy institucí

V první fázi vybrané instituce vytvoří svůj vlastní katalog PSI na základě dodané jednotné metodiky18. Tyto pilotní katalogy by sloužily jako základní datová báze pro systém centralizovaného katalogu, kam by byly na závěr této fáze importovány. Každá instituce by později v centralizovaném katalogu vlastnila svůj modul, za který by zodpovídala a měla možnost editace záznamů.

2. fáze: Pilotní centralizovaný katalog PSI

Po importu záznamů z pilotních katalogů jednotlivých institucí bude zahájen pilotní běh centralizovaného katalogu, kde bude každá instituce zodpovídat za svůj model, aktuálnost údajů apod. Zároveň bude probíhat informační kampaň a přidávání nových institucí, které budou vkládat své záznamy dle metodiky aktualizované na základě první fáze.

3. fáze: Plná verze centralizovaného katalogu PSI

V případě příslušných legislativních změn by měly všechny určené instituce povinnost vést v centralizovaném katalogu svůj modul, za který by plně zodpovídala. Případný zájemce o data by se z těchto záznamů dozvěděl všechny potřebné informace (struktura, aktuálnost, kvalita apod.) a jejich dostupnosti (distribuční kanál, licencování, cena apod.).

Samozřejmě by mohla následovat další fáze, ve smyslu výše uvedeného projektu data.gov, tzn. že by katalog umožňoval přímé stažení dat, ovšem vzhledem k různorodosti datových výstupů veřejné správy není tato fáze nyní aktuální. Úspěchem by byl již systém, který by poskytoval komplexní přehled o tom, jaká data jsou k dispozici, kde je možné je získat a za jakých podmínek.

4 Závěr

Tento článek měl za úkol představit současnou situaci a možnost vývoje jednotného centralizovaného katalogu informací veřejného sektoru České republiky. Asi nejdůležitějším předpokladem úspěšné realizace je změna legislativy takovým způsobem, aby udržování záznamů v rámci katalogu bylo pro veřejné instituce ze zákona povinné. Ovšem i dnes některé instituce české veřejné správy podobné katalogy vedou, nejaktivnější je v tomto směru zřejmě Český statistický úřad (ČSÚ), který poskytuje tzv. Ceník služeb a produktů,19 který je možné považovat za základní příklad katalogu dat, které instituce veřejné správy nabízí k dalšímu využití. Nutno poznamenat, že původní verze ceníku byla mnohem obsáhlejší a obsahovala i některé informace o vlastnostech nabízených dat, které nyní zcela chybí. Na druhou stranu ČSÚ nabízí také tzv. eKatalog geografických produktů,20 který je zpracován zcela profesionálně – nabízené geografické datové sady jsou popsány jednotným a vyčerpávajícím způsobem21.

Základním předpokladem úspěšné implementace centrálního katalogu je v současné době především vytvoření kvalitního pilotního projektu, do kterého budou zapojeny vybrané instituce české veřejné správy. Úspěch projektu by mohl spustit proces legislativních změn, které vytvoří základní rámec pro centralizovaný katalog. Z finančního hlediska by se náklady vrátily velice rychle z vybraných poplatků za poskytnutí samotných dat, které již dnes tvoří významnou součást příjmů některých institucí.

Přečtete si doplnění k tomuto článku v minisloupku od recenzenta Michala Rady.

Použité zdroje:

  1. Aliancia Fair-play. Datanest [online]. Bratislava : Aliancia Fair-play, 2010 [cit. 01.07.2011]. Dostupné z WWW: < http://datanest.fair-play.sk>.
  2. CDI. Digitalisér.dk [online]. København : IT- og Telestyrelsen, 2009 [cit. 01.07.2011]. Dostupné z WWW: < http://digitaliser.dk>.
  3. DAVIES, Rob. Topic Report No. 8: PSI Portals - Overview of Progress (Part 1). ePSIplatform [online]. EU : ePSIplatform, 2011 [cit. 01.07.2011]. Dostupné z WWW: <http://www.epsiplus.net/topic_reports/topic_report_no_8_psi_portals_overview_of_progress_part_1/topic_report_no_8_psi_portals_overview_of_progress_part_1>.
  4. Česko. Statistický úřad. Český statistický úřad [online]. Praha : Český statistický úřad, 2011 [cit. 01.07.2011]. Ceník služeb a produktů. Dostupné z WWW: <http://czso.cz/csu/redakce.nsf/i/cenik_sluzeb_a_produktu_ke_stazeni/$File/cenik_sluzeb_a_produktu_csu.pdf>.
  5. Česko. Statistický úřad. Český statistický úřad [online]. Praha : Český statistický úřad, aktual. 08.04.2011 [cit. 01.07.2011]. eKatalog geografických produktů. Dostupné z WWW: <http://czso.cz/csu/rso.nsf/i/ekatalog_gp>.
  6. Česko. Zákon č. 106 ze dne 11. května 1999 o svobodném přístupu k informacím. In Sbírka zákonů České republiky. 1999, částka 39, s. 2578-2582. Dostupný také z WWW: <http://www.mvcr.cz/sbirka/1999/sb039-99.pdf>.
  7. Evropská společenství. Směrnice EK č. 2003/98/EC o opakovaném využití informací veřejného sektoru [online]. 2003 [cit. 01.07.2011]. Dostupný z WWW: <http://www.czechpsi.info/data/2003_98_EC_cesky_preklad.pdf>.
  8. Evropská společenství. Lisabonská strategie [online]. 2000 [cit. 01.07.2011]. Dostupný z WWW: <http://www.euractiv.com/future-eu/lisbon-agenda/article-117510>.
  9. Fundación CTIC. Open Data @ CTIC [online]. Gijón : CTIC, 2011 [cit. 01.07.2011]. About. Dostupné z WWW: <http://datos.fundacionctic.org/about/>.
  10. Her Majesty’s Government. Data.gov.uk – Opening up government [online]. 2010 [cit. 01.07.2011]. Dostupný z WWW: <http://data.gov.uk>.
  11. PEKÁREK, Aleš. Výzkum informací veřejného sektoru České republiky. Ikaros [online]. 2009, roč. 13, č. 3 [cit. 01.07.2011]. Dostupné z WWW: <http://ikaros.cz/node/5297>.

  1. 1. Public Sector Information
  2. 2. Viz např. tzv. Lisabonská strategie http://www.euractiv.com/future-eu/lisbon-agenda/article-117510
  3. 3. http://www.czechpsi.info/data/2003_98_EC_cesky_preklad.pdf
  4. 4. http://www.czechpsi.info/data/ZakUZ-1999-106_svob-pristup-info_zneni2007...
  5. 5. podrobněji viz http://www.epsiplus.net/psi_library/reports/member_state_eea_efta_transp...
  6. 6. z anglického „data mining“
  7. 7. http://ec.europa.eu/information_society/policy/psi/actions_eu/policy_act...
  8. 8. http://www.oecd.org/dataoecd/10/22/36481524.pdf
  9. 9. http://ikaros.cz/node/5297
  10. 10. http://www.epsiplus.net/
  11. 11. Tím je míněn např. kompletní datový výstup databáze; v praxi se často zaměňuje za „zdrojový kód“, který u té stejné databáze na rozdíl od zdrojových dat podléhá ochraně duševního vlastnictví
  12. 12. http://datos.fundacionctic.org/about/
  13. 13. http://www.epsiplus.net/content/download/59063/817610/version/1/file/ePS...
  14. 14. Davies odkazuje na britský vládní server, který patří v Evropě mezi nejvyspělejší.
  15. 15. http://data.gov.uk/
  16. 16. http://digitaliser.dk/
  17. 17. http://datanest.fair-play.sk/
  18. 18. Např. použitý software, struktura záznamů apod.
  19. 19. http://czso.cz/csu/redakce.nsf/i/cenik_sluzeb_a_produktu_ke_stazeni/$File/cenik_sluzeb_a_produktu_csu.pdf
  20. 20. http://czso.cz/csu/rso.nsf/i/ekatalog_gp
  21. 21. Příklad záznamu v katalogu viz http://czso.cz/csu/rso.nsf/i/casti_obce_dily
14.10.2011

PEKÁREK, Aleš. Současný stav a výhledy v oblasti vývoje centralizovaného katalogu informací veřejného sektoru ČR. ProInflow [online]. 14.10.2011 [cit. 17.05.2012]. Dostupný z WWW: <http://pro.inflow.cz/soucasny-stav-vyhledy-v-oblasti-vyvoje-centralizovaneho-katalogu-informaci-verejneho-sektoru-cr>. ISSN 1804–2406.