Ano ang SAV file?
Ang SAV file ay isang data file na ginawa ng Statistical Package for the Social Sciences(SPSS), na isang application na malawakang ginagamit ng mga market researcher, health researcher, survey company, gobyerno, education researcher, marketing organization, data miners para sa statistical analysis. Ang SAV ay na-save sa isang proprietary binary na format at binubuo ng isang dataset pati na rin ang isang diksyunaryo na kumakatawan sa dataset, nagse-save ng data sa mga row at column.
SAV File Format
Ang format ng SAV file ay naging medyo matatag, ngunit hindi namin masasabing ito ay static. Ang backwards at forwards compatibility ay opsyonal na magagamit kung kinakailangan, ngunit hindi pinananatili ng maayos. Ang data sa isang SAV file ay ikinategorya sa mga sumusunod na seksyon:
Header ng file
Binubuo ito ng 176 bytes. Ang unang 4 na byte ay nagpapahiwatig ng string $FL2 o $FL3 sa character encoding na ginamit para sa file. Ang huling tatlong byte ay kumakatawan na ang data sa file ay na-compress gamit ang ZLIB. Ang susunod na 60-byte na string ay magsisimula @(#) SPSS DATA FILE at tinutukoy din ang operating system at bersyon ng SPSS na lumikha ng file. Ang header ay magpapatuloy sa anim na digit na field, na naglalaman ng bilang ng mga variable sa bawat obserbasyon at isang digit na code para sa compression, at nagtatapos sa data ng character na nagsasaad ng petsa at oras ng paggawa at isang label ng file.
Mga tala ng deskriptor ng variable
Ang talaan ay naglalaman ng isang nakapirming pagkakasunud-sunod ng mga patlang, pag-uuri ng uri at pangalan ng variable kasama ng impormasyon sa pag-format na ginagamit ng SPSS. Ang bawat variable na tala ay maaaring opsyonal na maglaman ng variable na label na hanggang 120 character at hanggang sa tatlong nawawalang halaga na mga detalye.
Mga label ng halaga
Ang mga label ng halaga ay opsyonal at nakaimbak sa mga pares ng mga tala na may mga integer na tag 3 at 4. Ang unang tala na tag 3 ay may pagkakasunod-sunod ng mga pares ng mga field, ang bawat pares ay naglalaman ng isang halaga at ang nauugnay na label ng halaga. Ang pangalawang tala na tag 4, ay kumakatawan kung aling mga variable ang nalalapat sa hanay ng mga value/label.
Mga dokumento
Isa o maramihang record na may integer tag 6. Opsyonal na dokumentasyon. naglalaman ng 80-character na linya.
Mga tala ng extension
Ang isa o maramihang talaan na may tag na integer 7. Ang mga talaan ng extension ay nagbibigay ng impormasyon na maaaring hindi papansinin nang ligtas, ngunit napangalagaan, sa maraming sitwasyon, ay nagbibigay-daan para sa mga file na isinulat ng mas bagong software upang mapanatili ang pabalik na pagkakatugma. Ang mga talaan ng extension ay may mga integer na subtype na tag.
Terminator ng diksyunaryo
I-record lamang gamit ang integer tag na 999. Ito ay naghihiwalay sa diksyunaryo mula sa mga obserbasyon ng data.
Mga obserbasyon sa datos
Ito ay isinasaalang-alang bilang ang data ay nasa pagkakasunud-sunod ng pagmamasid, hal. lahat ng variable na value para sa unang obserbasyon, na sinusundan ng lahat ng value para sa pangalawang obserbasyon, atbp. Ang format ng data record ay nag-iiba depende sa compression code sa file header record. Ang bahagi ng data ng isang .sav file ay maaaring hindi ma-compress:
- code 0: na-compress ng bytecode
- code 1: na-compress gamit ang ZLIB compression