Národní webový archiv

V Inflow shrnuli obsah příspevku, který zazněl v prosinci na konferenci Archivy, knihovny, muzea v digitálním světě 2008:

Přístup k národnímu webovému archivu
Bc. Tomáš Síbek, Mgr. Lukáš Gruber, Národní knihovna ČR

Pánové Síbek a Gruber hovořili o archivaci webu – proč a jak archivovat. Od 90. let postupně narůstá důležitost elektronických dokumentů. To je spojeno i s rozvojem sítě Internet, která do značné míry změnila pohled na práci s informacemi. Publikování se stalo dostupné všem a síťová dostupnost zbourala velkou část dřívějších bariér. S rozvojem technologií klesá potřeba dokumenty tisknout a vůbec šířit na hmotných nosičích. Dokumenty publikované pouze v rámci internetu se nazývají eBorn. Tyto síťově dostupné dokumenty mají ale poměrně krátkou životnost – průměrně cca 75 dní. Významná část kulturního dědictví se přesouvá na internet. Z dlouhodobého hlediska se ale jedná o nestabilní prostředí, které je velmi dynamické. Pokud nechceme nenávratně přijít o tyto elektronické dokumenty, je nutné zavést do praxe archivaci webu. V České republice se o řešení problematiky snaží WebArchiv. Doposud se zajímali hlavně o archivaci webových stránek v národní doméně .cz. Podle statistik bylo v září 1999 registrováno 41 351 domén .cz, v roce 2008 bylo registrováno 484 256 domén .cz, to svědčí o naléhavosti problematiky.

Pracovní postup začíná výběrem webových stránek, je důležité rozhodnout, které stránky mají být ukládány častěji. Následně se uloží do archivu a výsledkem je online dostupný archiv národního webu.

Poté jsme byli seznámeni s jednotlivými typy sklizní, kterými jsou celoplošné, výběrové a tematické sklizně. Co se týče softwaru, tak jsou k dispozici open source nástroje vyvinuté v rámci mezinárodní spolupráce, nástroje pro ukládání/sklízení webu (Heritrix) a pro zpřístupnění uživatelům (WayBack, Wera).

Problematikou není jen technické řešení, ale i zpřístupnění. Online nelze zpřístupnit zdaleka vše, autorský zákon vytváří rámec, kterého se WebArchiv musí držet. Vlastním řešením je licence Creative Commons. Takto tedy pracovníci projektu Webarchiv v současné době řeší problematiku získání souhlasu autora s online zpřístupňováním archivovaných kopií. Nicméně nejsou to řešení vhodná v horizontu dlouhodobého intervalu. Je nutné zavést mohutnější právní rámec, který by vytvořil liberálnější prostředí pro archivaci webu, zejména s ohledem vytvoření veřejného přístupu k webu. Dalším řešením je Návrh zákona o povinných síťových publikacích, který je v současné době předložen ústřední knihovnické radě ČR a v přípravě na legislativním odboru MK ČR.

celý článek: inflow.cz
prezentace: docs.google.com