.SAVファイルとは何ですか?
SAVファイルは、社会科学用統計パッケージ(SPSS)によって作成されたデータファイルであり、市場研究者、健康研究者、調査会社、政府、教育研究者、マーケティング組織、統計分析のためのデータマイナーによって広く使用されているアプリケーションです。独自のバイナリ形式で保存され、データセットとデータセットを表す辞書で構成される SAV は、データを行と列に保存します。
SAV ファイル形式
SAV ファイル形式は比較的安定していますが、静的とは言えません。後方互換性と前方互換性は、必要に応じてオプションで利用できますが、適切に維持されていません。 SAV ファイルのデータは、次のセクションに分類されます。
ファイルヘッダー
176 バイトで構成されます。最初の 4 バイトは、ファイルに使用される文字エンコーディングで文字列 $FL2 または $FL3 を示します。最後の 3 バイトは、ファイル内のデータが ZLIB を使用して圧縮されていることを表します。次の 60 バイトの文字列は @(#) SPSS DATA FILE で始まり、ファイルを作成したオペレーティング システムと SPSS のバージョンも特定します。ヘッダーは、観測ごとの変数の数と圧縮用の数字コードを含む 6 桁のフィールドで続き、作成日時とファイル ラベルを示す文字データで終わります。
可変記述子レコード
レコードには、SPSS で使用されるフォーマット情報とともに、変数の型と名前を分類する一連のフィールドが含まれています。各変数レコードには、オプションで最大 120 文字の変数ラベルと最大 3 つの欠損値指定を含めることができます。
値ラベル
値ラベルはオプションで、整数タグ 3 と 4 を持つレコードのペアに格納されます。タグ 3 である最初のレコードには一連のフィールドのペアがあり、各ペアには値と関連する値ラベルが含まれます。タグ 4 である 2 番目のレコードは、値/ラベルのセットが適用される変数を表します。
ドキュメント
整数タグ付きの単一または複数のレコード 6. オプションのドキュメント。 80 文字の行が含まれています。
拡張レコード
整数タグ付きの単一または複数のレコード 7. 拡張レコードは、安全に無視できる情報を提供しますが、多くの場合、新しいソフトウェアで作成されたファイルの後方互換性を維持するために保持されます。拡張レコードには、整数のサブタイプ タグがあります。
辞書ターミネータ
整数タグ 999 を持つレコードのみ。これにより、ディクショナリがデータ観測から分離されます。
データ観測
これは、データが観測順であると見なされます。たとえば、最初の観測ではすべての変数値が続き、2 番目の観測ではすべての値が続きます。データ レコードの形式は、ファイル ヘッダー レコードの圧縮コードによって異なります。 .sav ファイルのデータ部分は圧縮解除できます。
- code 0: バイトコードで圧縮
- コード 1: ZLIB 圧縮を使用して圧縮