Data Fountains

Innen: MIA

A University of California, Riverside könyvtára által 2005 és 2014 között C++ nyelven fejlesztett "iVia Virtual Library Software" nevű open source szoftvercsomag egyik modulja, mellyel internetes információforrások találhatók meg és írhatók le. Lényegében egy web scraping eszköz metaadatok és szövegek kinyerésére fókuszál aratással begyűjtött weboldalakból (pl. virtuális könyvtárak, tematikus portálok, linkgyűjtemények építéséhez). Az adatok CSV és XHTML fájlokba, MARC rekordokba, ill. OAI-PMH protokoll szerint is exportálhatók. A Data Fountains a szintén a csomag részét képező háromféle focused crawler: Expert Guided Crawler, Targeted Link Crawler, Nalanda iVia Focused Crawler egyikével tudja begyűjteni a weboldalakat.