Archive-friendly website

A MIA wikiből

Olyan webhely, amely nemcsak crawler-friendly, vagyis robotokkal könnyen bejárható, hanem jó minőségben archiválható is: a lementett változat tartalmában, megjelenésében és funkcionalitásában kellően hű mása az eredetinek. Többek között ilyen szempontoknak érdemes megfelelni:

  • logikus site-struktúra, amelynek a felépítése az URL címekben is tükröződik, mert így könnyebb kiválasztani az archiválásra érdemes részeket és utólag ellenőrizni az eredményt
  • valid HTML és CSS kód, ami lehetővé teszi a helyes megjelenítést a szabványokat követő böngészőkben a jövőben is
  • ékezetek és egyes speciális karakterek kerülése az alkönyvtárak és a fájlok neveiben
  • lehetőleg nyílt fájlformátumok használata, melyek hosszú távon is megjeleníthetők maradnak
  • nincs benne olyan speciális formátumú tartalom, amihez külön megjelenítőt/böngésző-kiegészítőt kell telepíteni
  • a hang és a videó tartalom nem sugárzott (stream) módon van beágyazva, hanem letölthető fájlok formájában (is)
  • a robots.txt fájlban nincs letiltva a külalakot szabályozó (pl. .css) fájlok letöltése
  • nem tartalmaz olyan szerver oldalon futó scripteket, programokat, vagy adatbázist, amelyek nélkül a website használhatatlan
  • a webszerver nem használ olyan session vagy persistent típusú cookie-kat, amelyek alapvetően befolyásolják a megjelenő tartalmat (pl. a felhasználói felület nyelvét)
  • részletes beágyazott metaadatok vannak a weboldalak fejlécében és az egyéb dokumentumokban (pl. képek, PDF fájlok), melyek megkönnyítik a begyűjtött digitális objektumok beazonosítását és automatikus metaadatolását
  • a készítés vagy az utolsó módosítás dátumának feltüntetése a weboldalakon és a dokumentumokban, hogy az archivált változat használója meg tudja állapítani, mikor készültek (ne csak azt lássa, hogy mikor lettek archiválva)
  • a webhely jogi közleményében kitér az archiválásra is (pl. "archiválható, de csak fél év után szolgáltatható és csak könyvtáron belül"), vagy egy CC licenccel szabályozza a felhasználást az archivált példány esetében is.

Az archiválhatósági jellemzők egy része könnyen ellenőrizhető egy website esetében olyan szolgáltatásokkal, mint például az Archive Ready.