Jsou také vaše stránky navždy zaznamenány?

Články vycházející průběžně ve webových novinách Ahasweb se stávají průběžně od roku 2002 součástí světového kulturního dědictví :) Znamená to, že i pokud budou v budoucnosti bez náhrady vymazány ze své současné domény www.ahasweb.cz, budou i nadále a trvale k dispozici do té doby vyšlé články v české databázi Webarchiv a pravděpodobně také v mezinárodní databázi Internet Archive. WebArchiv je digitální archiv českých webových zdrojů, které jsou zde shromažďovány za účelem jejich dlouhodobého uchování. Ochranu a uchování těchto dokumentů zajišťuje od roku 2000 Národní knihovna ČR ve spolupráci s Moravskou zemskou knihovnou a Ústavem výpočetní techniky Masarykovy univerzity. Pro archivaci webu jsou využívány nástroje vyvinuté organizací Internet Archive, resp. konsorciem IIPC (International Internet Preservation Consortium). Od roku 2007 je členem IIPC i WebArchiv. Český projekt se striktně drží paragrafů našeho autorského zákona a tak se vám po úspěšném nalezení hledaného URL může stát, že se dočkáte pouze zobrazení zprávy "Z důvodu omezení Zákonem č. 121/2000 Sb. (autorský zákon) může být tento dokument zobrazen pouze v prostorách knihovny." Můžete se ale pokusit nalézt hledané ve veřejném Internet Archive, který se českým autorským zákonem neřídí.

Ahaswebovy noviny byly zařazeny do této databáze poté, co byly bez mého přičinění správci Webarchivu vybrány v roce 2002 při "celoplošné sklizni", tedy čtyři roky po svém založení. Kriteria výběru pro zařazení webových stránek do Webarchivu najdete na adrese Webarchiv.cz/kriteria#vyber. Podmínky nejsou jednoduché, ale i vy můžete navrhnout zařazení některých vašich oblíbených stránek do Webarchivu. Stránky musí splňovat některá základní kriteria: dokument byl vydán na území České republiky, jeho jazykem je čeština, autor je české národnosti, obsah se týká České republiky nebo českého národa. Jsou vybírány především materiály významné kulturní či vědecké hodnoty, které vznikají jako původní digitální díla (tz. nemají souběžnou tištěnou podobu). Podrobnosti podmínek a formulář pro zadání vašeho návrhu najdete zde. Určitě si ale předtím ověřte, zda vámi navrhované stránky již nejsou ve Webarchivu zahrnuty na stránce Vyhledej.

Hledáním ve Webarchivu můžete najít i takové stránky, které mezitím z internetu zmizely, což je vlastní smysl tohoto archivu. Lze s úspěchem tvrdit, že každé internetové stránky jednoho dne zmizí v nenávratnu. Webarchiv se snaží zachránit alespoň část z nich, snad ty hodnotnější. Odkazy v těchto "zmizelých" uváděné ale nemusí vždy fungovat, protože odkazovaný obsah nemusí být součástí Webarchivu. Pak se dočkáte pouze zprávy "Not in Archive", případně i známé hlášky "Not Found". Přesto je realizace tohoto projektu dobrým pokusem uchovat zejména pro historiky internetové texty nejrůznějších autorů přesto, že byly z internetu ať už autory nebo správci obsahu z nejrůznějších důvodů vymazány. Bohužel rychlost odezvy dat z archivu je dosti pomalá a algoritmy sběru s ukládáním dat nejsou precizní, takže často chybí obrázky nebo není správně interpretován původní kód stránky. Při průzkumu v mezinárodní databázi Internet Archive jsem například zjistil, že "nejlepší" výchozí stránkou pro hledání článků je pro Ahasweb stránka ARCHIV zapsaná v roce 2008. Zdá se, že odkazy z ní vedené jsou v archivu vždy nalezeny, i když nalezení dat v rozsáhlé mezinárodní databázi trvá nezvykle dlouho.

Další podrobnosti zejména o způsobu provádění "sklizní" a používaných nástrojích naleznete v článku Adama Brokeše Projekt WebArchiv - archiv českého webu. Český Webarchiv je součástí projektu Národní digitální knihovna, více zde.
22.1.2009 11:00 [Trvalá adresa tohoto článku.]

Některé odkazy na cizí zdroje nemusí být s ohledem na časový odstup funkční.


Creative Commons License
Ahasweb, jehož autorem je Jan Bílek, podléhá licenci Creative Commons
Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česko
.