Profilování kolekce a stanovení určené skupiny WebArchivu Národní knihovny ČR

Roč.6,č.1(2014)

Abstrakt

V příspěvku jsou popsány kroky, které povedou k vytvoření strategie dlouhodobé ochrany dat sklizených z internetu v rámci projektu WebArchiv, která je nutným předpokladem k jejich ochraně v řádu desítek let. Tato strategie obsahuje pravidla a postupy, které zajistí dlouhodobou použitelnost a přístup archivních dat. V současné době je datům sklizeným z internetu v rámci projektu WebArchiv poskytována pouze ochrana na úrovni bit-streamu, která není v delším časovém horizontu dostatečná. Článek pojednává nejen o dosud provedených krocích v Národní knihovně (analýza formátů), na základě kterých bude vytvořen profil kolekce, ale i o krocích budoucích jako je definování určené skupiny, implementaci některých z plánovacích nástrojů a evaluaci potenciálních ochranných řešení.

 

Collection Profilling and Defining the Designated Community in Web Archiving Project of National Library of the Czech Republic

Current bit stream data preservation practice in Web Archive of National Library of the Czech Republic is insufficient in long term. Presented paper describes steps leading to the Long Term Preservation policy for our collection. It introduces strategies, best practices and actions required for long term usability and accessibility. It also mentions accomplished actions such file format analysis, enabling us to create the collection profile. Among planned steps is designated community description, planning tools implementation and evaluation of preservation solutions.

 

Jaroslav Kvasnica, Barbora Bjačková

Národní knihovna České republiky
Oddělení archivace webu
Klementinum 190
110 00 Praha 1


Klíčová slova:
WebArchiv, archivace webu, profil kolekce, určená skupina, dlouhodobá ochrana digitálních dokumentů
Reference

 1. ALSUM, Ahmed, Michele C. WEIGLE, Michael L. NELSON a Herbert VAN DE SOMPEL. Profiling web archive coverage for top-level domain and content language. International Journal on Digital Libraries [online]. 2014 [cit. 2014-07-15]. DOI: 10.1007/s00799-014-0118-y. Dostupný z: http://link.springer.com/10.1007/s00799-014-0118-y | DOI 10.1007/s00799-014-0118-y
 2. ČSN ISO 14721. Systémy pro přenos dat a informací z kosmického prostoru - Otevřený archivační informační systém - Referenční model. Praha: Úřad pro technickou normalizaci, metrologii a státní zkušebnictví, Srpen 2014.
 3. ČSN ISO 16363. Systémy pro přenos dat a informací z kosmického prostoru - Audit a certifikace důvěryhodných digitálních úložišť. Praha: Úřad pro technickou normalizaci, metrologii a státní zkušebnictví, Říjen 2014.
 4. DAY, M. The Long-Term Preservation of Web Content. In: MASANÈS, J., ed. Web archiving. New York: Springer, c2006, s. 177-199. ISBN 978-3-540-23338-1.
 5. FOJTŮ, Andrea. Plánování dlouhodobé ochrany pomocí nástroje PLATO Preservation Planning Tool. Národní knihovna České republiky [online]. 2011 [cit. 2014-07-21]. Dostupný z: http://www.nkp.cz/soubory/ostatni/vav2011-plato-vav2-jh.pdf
 6. LAKSHMI, V. a S. C. JINDAL. Digital libraries. Delhi: Isha Books, 2004. ISBN 81-820-5109-6.
 7. LAVOIE, Brian F. The Open Archival Information System Reference Model: Introductory Guide [online]. OCLC: Dublin, Ohio, 2004 [cit. 2014-7-14]. 20 s. Dostupný z: http://www.dpconline.org/docs/lavoie_OAIS.pdf
 8. KVASNICA, Jaroslav a Rudolf KREIBICH. Formátová analýza sklizených dat v rámci projektu WebArchiv NK ČR. ProInflow [online]. 31.10.2013 [cit. 2014-07-21]. ISSN 1804–2406. Dostupný z: http://www.phil.muni.cz/journals/index.php/proinflow/article/view/779.
 9. KVAŠOVÁ, Zuzana a Tomáš SVOBODA. Dlouhodobá ochrana elektronických publikací. ProInflow [online]. 31.10.2013 [cit. 2014-07-21]. ISSN 1804–2406. Dostupný z: http://www.phil.muni.cz/journals/index.php/proinflow/article/view/775.
 10. PETROV, Petar. To fits or not to fits. Open Planets Foundation [online]. 2012 [cit. 2014-07-21]. Dostupný z: http://openplanetsfoundation.org/blogs/2012-07-27-fits-or-not-fits
 11. RESEARCH LIBRARIES GROUP (RLG). Trusted Digital Repositories: Attributes and Responsibilities [online]. 2012 [cit. 2014-7-15]. Dostupný z: http://www.oclc.org/content/dam/research/activities/trustedrep/repositories.pdf
 12. REYNOLDS, E. If We Capture, Will They Come? Researcher Uses for Web Archive Collections. In: The Signal: Digital Preservation [online]. Library of Congress, 2013 [cit. 2014-07-16]. Dostupný z: http://blogs.loc.gov/digitalpreservation/2013/03/if-we-capture-will-they-come-researcher-uses-for-web-archive-collections/