Какво е SAV файл?
SAV файлът е файл с данни, създаден от Статистическия пакет за социалните науки (SPSS), който е приложение, широко използвано от пазарни изследователи, здравни изследователи, анкетни компании, правителство, изследователи в образованието, маркетингови организации, копачи на данни за статистически анализи. SAV се запазва в собствен двоичен формат и се състои от набор от данни, както и речник, които представляват набора от данни, записва данни в редове и колони.
SAV файлов формат
Файловият формат SAV стана относително стабилен, но не можем да кажем, че е статичен. Съвместимостта назад и напред е опционално налична, когато е необходимо, но не се поддържа правилно. Данните в SAV файл са категоризирани в следните раздели:
Заглавка на файл
Състои се от 176 байта. Първите 4 байта показват низа $FL2 или $FL3 в кодирането на знаци, използвано за файла. Последните три байта показват, че данните във файла са компресирани с помощта на ZLIB. Следващият 60-байтов низ започва @(#) SPSS DATA FILE и също така определя операционната система и SPSS версията, която е създала файла. След това заглавката продължава с шестцифрени полета, съдържащи броя на променливите за наблюдение и цифров код за компресиране, и завършва със символни данни, указващи дата и час на създаване и етикет на файл.
Записи на променливи дескриптори
Записът съдържа фиксирана последователност от полета, класифициращи типа и името на променливата заедно с информация за форматиране, използвана от SPSS. Всеки запис на променлива може по избор да съдържа етикет на променлива с до 120 знака и до три спецификации на липсващи стойности.
Етикети със стойност
Етикетите на стойността не са задължителни и се съхраняват в двойки записи с целочислени тагове 3 и 4. Първият запис, който е етикет 3, има поредица от двойки полета, като всяка двойка съдържа стойност и свързания етикет на стойността. Вторият запис, който е етикет 4, представлява за кои променливи се отнася наборът от стойности/етикети.
Документи
Единични или множество записи с целочислен таг 6. Незадължителна документация. съдържа редове от 80 знака.
Записи за разширение
Единични или множество записи с целочислен таг 7. Разширените записи предоставят информация, която може да бъде игнорирана безопасно, но запазена в много ситуации, позволява на файловете, написани от по-нов софтуер, да запазят обратната съвместимост. Записите за разширение имат етикети за подтипове на цели числа.
Терминатор на речника
Записвайте само с целочислен таг 999. Той разделя речника от наблюденията на данните.
Наблюдения на данни
Счита се, че данните са в ред на наблюдение, напр. всички стойности на променливи за първото наблюдение, последвани от всички стойности за второто наблюдение и т.н. Форматът на записа с данни варира в зависимост от кода за компресиране в записа на заглавката на файла. Частта с данни на .sav файл може да бъде декомпресирана:
- код 0: компресиран от байт код
- код 1: компресиран чрез ZLIB компресия