Headless browser

A MIA wikiből

Olyan webböngésző, amelynek nincsen grafikus felhasználói felülete, de ugyanúgy tudja értelmezni a weboldalak HTML kódját, végrehajtani a bennük levő JavaScript/AJAX parancsokat, mint a népszerű grafikus browserek. Mivel parancssorból vagy scriptekkel működtethetők, elsődleges felhasználási területük a weboldalak tesztelése, a megjelenítéssel kapcsolatos hibák felderítése, de emellett a weblapok oldalképeit is elő tudják állítani (és fájlba menteni), és webarchiváló eszközként is használhatók, különösen olyan tartalmak letöltésénél, amelyekkel a hagyományos crawlerek nem, vagy nem jól boldogulnak, mert a headless browserek egy emberi felhasználó viselkedését tudják szimulálni. (Utóbbi miatt kártékony célokat is szolgálhatnak: pl. túlterheléses támadás webhelyek ellen, a reklámok nézettségének látszólagos növelése.) Az egyik legfejlettebb headless browser a PhantomJS, amit pl. a UK Webarchive is használ képek készítésére a lementett weboldalakról. (Hátránya, hogy 12-szer lassabban dolgozik, mint a Heritrix.)