Che cos’è un file XAR?
Un file con estensione .xar (Extensible Archive Format) è un archivio UNIX che può essere in formato compresso o non compresso. Viene utilizzato anche su Mac OS per l’installazione di pacchetti. XAR è open-source e faceva parte di Mac OS X 10.5 per l’utilizzo con il browser Safari.
Formato file XAR
Un file XAR ha tre regioni principali.
- Intestazione
- Sommario
- Cumulo
Intestazione XAR
L’intestazione XAR è strutturata come segue.
Campo | Tipo di dati | Dimensioni in byte |
---|---|---|
Magic | Senza segno Int 32 | 4 |
Taglia | Senza segno Int 16 | 2 |
Versione | Senza segno Int 16 | 2 |
Lunghezza TOC compressa | Unsigned Int 64 | 8 |
TOC Length UnCompressed | Unsigned Int 64 | 8 |
Checksum | Senza segno Int 32 | 4 |
Nome digest del messaggio | Null terminato |
La struttura C dell’intestazione XAR può essere definita come segue.
struct xar_header {
uint32_t magic;
uint16_t size;
uint16_t version;
uint64_t toc_length_compressed;
uint64_t toc_length_uncompressed;
uint32_t cksum_alg;
/* A nul-terminated, zero-padded to multiple of 4, message digest name
* appears here if cksum_alg is 3 which must not be empty ("") or "none".
*/
};
Nota che tutti i campi dell’intestazione (magic, size, version, toc_length_compressed, toc_length_uncompressed, cksum_alg) sono sempre archiviati nei file XAR in ordine di byte di rete (aka big endian).
XAR Sommario (TOC)
Il sommario è un documento XML che è (e deve) essere codificato come UTF-8. Viene memorizzato all’inizio del file, semplificando la scansione dell’archivio per estrarre il singolo file. L’archivio XAR consente di comprimere/codificare i singoli file nell’archivio in modo indipendente utilizzando diversi schemi di compressione come GZIP, BZIP2 e altri simili.
<?xml version="1.0"?>
<xar>
<toc>
<checksum style="sha1">
<size>20</size>
<offset>0</offset>
</checksum>
<file id="1">
<name>xar</name>
<type>file</type>
<mode>0755</mode>
<uid>0</uid>
<gid>0</gid>
<user>root</user>
<group>wheel</group>
<size>81180</size>
<data>
<offset>0</offset>
<size>74108</size>
<length>23083</length>
<extracted-checksum style="md5">d852c77ac3c8e83f312c12b4c3198e6d</checksum>
<archived-checksum style="md5">ceaf793ccb1990ecbadb20112d5f9e5d</checksum>
<encoding style="application/x-gzip"/>
</data>
<ea>
<name>com.apple.ResourceFork</name>
<offset>0</offset>
<size>7072</size>
<length>3942</length>
<extracted-checksum style="md5">0f7061dca2d7411352377db0e53792db</checksum>
<archived-checksum style="md5">c72de8ac25abe462a930254d82958534</checksum>
<encoding style="application/x-gzip"/>
</ea>
</file>
</toc>
</xar>
Mucchio
L’heap inizia subito dopo il toc compresso. È un mucchio di dati non strutturato a cui fa riferimento il TOC. I valori di offset elencati in TOC iniziano dall’inizio dell’heap. I valori di lunghezza nel toc si riferiscono al numero effettivo di byte memorizzati nell’heap (compresso o meno) mentre il valore di dimensione si riferisce alla dimensione estratta dell’elemento (dopo la decompressione se necessario).