WARC

A MIA wikiből

(Web ARChive)

A crawler által begyűjtött digitális objektumok és metaadataik tárolására szolgáló formátum. Az eredetileg az Internet Archive által bevezetett ARC fájltípus továbbfejlesztett változata, 2009-ben szabványosított (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható.