webarchive-indexing

Innen: MIA

Nagyméretű webarchívumok indexelésére is alkalmas Python scriptek, melyekkel kinyerhetők az URL-ek a WARC (vagy ARC) csomagokból CDX indexfájlokba.