فایل SAV چیست؟
فایل SAV یک فایل دادهای است که توسط بسته آماری علوم اجتماعی (SPSS) ایجاد شده است، که یک برنامه کاربردی است که به طور گسترده توسط محققان بازار، محققان سلامت، شرکتهای نظرسنجی، دولت، محققان آموزشی، سازمانهای بازاریابی، استخراجکنندگان داده برای تجزیه و تحلیل آماری استفاده میشود. SAV در یک فرمت باینری اختصاصی ذخیره می شود و شامل یک مجموعه داده و همچنین یک فرهنگ لغت است که مجموعه داده را نشان می دهد، داده ها را در ردیف ها و ستون ها ذخیره می کند.
فرمت فایل SAV
فرمت فایل SAV نسبتاً پایدار شده است، اما نمی توانیم بگوییم ثابت است. سازگاری عقب و جلو در صورت لزوم به صورت اختیاری در دسترس است، اما به درستی نگهداری نمی شود. داده های موجود در یک فایل SAV به بخش های زیر دسته بندی می شوند:
هدر فایل
از 176 بایت تشکیل شده است. 4 بایت اول نشان دهنده رشته $FL2 یا $FL3 در رمزگذاری کاراکتر مورد استفاده برای فایل است. سه بایت آخر نشان می دهد که داده های موجود در فایل با استفاده از ZLIB فشرده شده است. رشته 60 بایتی بعدی @(#) SPSS DATA FILE شروع می شود و همچنین سیستم عامل و نسخه SPSS که فایل را ایجاد کرده است را تعیین می کند. سپس هدر با فیلدهای شش رقمی، شامل تعداد متغیرها در هر مشاهده و یک کد رقمی برای فشرده سازی ادامه می یابد و با داده های کاراکتری که تاریخ و زمان ایجاد و یک برچسب فایل را نشان می دهد، پایان می یابد.
رکوردهای توصیفگر متغیر
رکورد حاوی یک دنباله ثابت از فیلدها است که نوع و نام متغیر را به همراه اطلاعات قالب بندی مورد استفاده توسط SPSS طبقه بندی می کند. هر رکورد متغیر ممکن است به صورت اختیاری دارای یک برچسب متغیر تا 120 کاراکتر و حداکثر سه مشخصه مقدار از دست رفته باشد.
برچسب های ارزش
The value labels are optional and stored in pairs of records with integer tags 3 and 4. اولین رکورد که تگ 3 است دارای یک دنباله از جفت فیلدها است که هر جفت حاوی یک مقدار و برچسب مقدار مرتبط است. رکورد دوم که تگ 4 است، نشان می دهد که مجموعه مقادیر/برچسب ها برای کدام متغیر اعمال می شود.
اسناد
Single or multiple records with integer tag 6. اسناد اختیاری شامل خطوط 80 کاراکتری است.
رکوردهای پسوند
Single or multiple records with integer tag 7. رکوردهای برنامه افزودنی اطلاعاتی را ارائه می دهند که می توان آنها را به طور ایمن نادیده گرفت، اما در بسیاری از موقعیت ها نگهداری می شود، فایل های نوشته شده توسط نرم افزارهای جدیدتر را قادر می سازد تا سازگاری با گذشته را حفظ کنند. رکوردهای برنامه افزودنی دارای تگ های زیر نوع عدد صحیح هستند.
ترمیناتور دیکشنری
Only record with integer tag 999. دیکشنری را از مشاهدات داده جدا می کند.
مشاهدات داده ها
در نظر گرفته می شود که داده ها به ترتیب مشاهده هستند، به عنوان مثال همه مقادیر متغیر برای مشاهده اول، به دنبال آن همه مقادیر برای مشاهده دوم، و غیره. فرمت رکورد داده بسته به کد فشرده سازی در رکورد هدر فایل متفاوت است. بخش داده یک فایل .sav را می توان از حالت فشرده خارج کرد:
- کد 0: فشرده شده توسط بایت کد
- کد 1: با استفاده از فشرده سازی ZLIB فشرده شده است