JHOVE2

Innen: MIA
A lap korábbi változatát látod, amilyen Admin (vitalap | szerkesztései) 2017. július 25., 20:34-kor történt szerkesztése után volt. (Új oldal, tartalma: „A Harvard University and JSTOR Electronic Archiving Initiative által fejlesztett, Java-ban írt open source alkalmazás és keretrendszer fájlok formátumának felism…”)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

A Harvard University and JSTOR Electronic Archiving Initiative által fejlesztett, Java-ban írt open source alkalmazás és keretrendszer fájlok formátumának felismeréséhez és jellemzéséhez. Ilyen kérdésekre ad választ egy - pl. egy webarchívumban található - ismeretlen fájl esetében: Mi ez? Tényleg az-e? Mit lehet róla tudni? Mi legyen vele? A válaszok négy munkafolyamatot igényelnek:

  • identification (a fájltípus valószínűsítése, pl. a fájlnév végződése vagy a fájlban levő, egyes formátumokra jellemző bájtok, "varázsszámok" alapján)
  • validation (annak az ellenőrzése, hogy a fájl szerkezete tényleg megfelel-e a valószínűsített formátumnak)
  • feature extraction (belső jellemzők, metaadatok kinyerése a fájlból, amelyek segítik a megőrzésére vonatkozó döntést)
  • assessment (az előre definiált szempontok alapján annak eldöntése, hogy mi legyen a fájllal, pl. milyen szintű megőrzésre érdemes)

A validation és a feature extraction műveletet ezekre a fájltípusokra tudja elvégezni: JPEG 2000, TIFF, PDF, SGML, XML, UTF-8 kódolású TEXT, ZIP, WAVE. (A korábbi JHOVE verzió még ezeket is ismerte: AIFF, GIF, HTML, JPEG, de az JHOVE2 projektben nem volt már rájuk pénzforrás.) Az identification funkció természetesen jóval több fájlformátumra működik.