Digitální archivace

"Digitální informace přetrvá na věky - nebo pět let, záleží, co přijde dřív."

- Jeff Rothenberg

Co je to digitální archivace?

Dlouhodobá ochrana digitálních dat má ze své podstaty mnoho definic, které se liší úhlem pohledu. Jedna z definic „digital preservation“, jak zní anglický výraz, vznikla v roce 2007 v rámci pracovní skupiny Americké asociace knihoven (ALA), která publikovala tři definice, krátkou, středně dlouhou a dlouhou.

Středně dlouhá definice zní: „Dlouhodobá ochrana digitálních dat spočívá v kombinaci plánů, strategií a opatření pro zajištění přístupu k reformátovanému a digitálně vzniklému digitálnímu obsahu bez ohledu na problémy spojené s nestálostí médií a technologickými změnami. Cílem dlouhodobé ochrany digitálních dat je přesné zobrazení autentického obsahu v jakémkoliv časovém horizontu od jeho vzniku.“

Poměrně široká definice Digital Preservation Coalition (DPC) říká, že dlouhodobá ochrana digitálních dat jsou vlastně: „všechny aktivity nutné k zajištění přístupnosti k digitálním materiálům i přes obtíže způsobené selháním médií nebo změnou technologií.

Z pohledu jednotlivých kroků dlouhodobou ochranu specifikuje Seamus Ross: „Dlouhodobá ochrana digitálních dat má za cíl zajistit, že uživatelé v budoucnu budou moci digitální informace nalézt, získat, zobrazit, manipulovat s nimi, interpretovat je a to vše přes konstantní změny technologií. Celý proces zahrnuje konzervaci, obnovování, výběr, mazání, vylepšování, updatování a přidávání kontextu.

Dlouhodobá ochrana je jednou ze součástí většího konceptu digitálního kurátorství. To se zabývá celým životním cyklem digitálního dokumentu a směřuje k jeho dlouhodobému uchování a použitelnosti.

Ve většině projektů a plánování pro dlouhodobou ochranu digitálních dat není doba ochrany přesně specifikována. Cíle dlouhodobé ochrany jsou v realitě střednědobé s tím, že se stále průběžně upravují. Díky tomu musí být procesy ochrany kontinuální a měly by jít dále a dále do budoucnosti.

Velmi pěkný obecný úvod do problematiky zastarávání HW i SW, budoucího zpřístupnění, správy dokumentů a vůbec dlouhodobého uchování digitálních dat napsal Seamus Ross v eseji Changing Trains at Wigan: Digital Preservation and the Future of Scholarship. Ve svém textu člení problémy na:

    • Podstatou fyzické: stárnutí nebo poškození nosičů dat (opotřebovanost, špatné podmínky uložení, porucha infrastruktury, přírodní pohroma), případně zastarávání HW.

    • Podstatou logické: ty lze shrnout jako možnou ztrátu použitelnosti a srozumitelnosti obsahu digitálních informací pro uživatele vzdálené v prostoru a čase, pro které je primárně obsah určen. Tito uživatelé nemají podporu tvůrce obsahu, který nemusí již vůbec existovat. Jediné, co bude k dispozici, jsou metadata - technická, administrativní, kontextová a jiná. Software nutný pro otevření konkrétního objektu už také nemusí být dostupný. Sami uživatelé se budou měnit a to včetně jejich návyků, očekávání i technologií, které používají. Logická ochrana na základě metadat umožní migraci dat a dokumentaci procesů, které vedou ke zpřístupnění i v budoucích technologických prostředích.