एसएवी फ़ाइल क्या है?
SAV फ़ाइल सांख्यिकीय पैकेज फॉर द सोशल साइंसेज (SPSS) द्वारा बनाई गई एक डेटा फ़ाइल है, जो कि बाज़ार शोधकर्ताओं, स्वास्थ्य शोधकर्ताओं, सर्वेक्षण कंपनियों, सरकार, शिक्षा शोधकर्ताओं, विपणन संगठनों, डेटा खनिकों द्वारा सांख्यिकीय विश्लेषण के लिए व्यापक रूप से उपयोग किया जाने वाला एप्लिकेशन है। SAV एक मालिकाना बाइनरी प्रारूप में सहेजा जाता है और इसमें डेटासेट के साथ-साथ एक शब्दकोश भी होता है जो डेटासेट का प्रतिनिधित्व करता है, डेटा को पंक्तियों और स्तंभों में सहेजता है।
एसएवी फ़ाइल प्रारूप
SAV फ़ाइल स्वरूप अपेक्षाकृत स्थिर हो गया है, लेकिन हम इसे स्थिर नहीं कह सकते। जहां आवश्यक हो, बैकवर्ड और फॉरवर्ड संगतता वैकल्पिक रूप से उपलब्ध है, लेकिन ठीक से बनाए नहीं रखा गया है। SAV फ़ाइल में डेटा को निम्नलिखित अनुभागों में वर्गीकृत किया गया है:
फाइल हेडर
इसमें 176 बाइट्स होते हैं। पहले 4 बाइट्स फ़ाइल के लिए उपयोग किए गए वर्ण एन्कोडिंग में स्ट्रिंग $FL2 या $FL3 इंगित करते हैं। अंतिम तीन बाइट्स दर्शाते हैं कि फ़ाइल में डेटा ZLIB का उपयोग करके संपीड़ित किया गया है। अगली 60-बाइट स्ट्रिंग @(#) SPSS DATA FILE शुरू होती है और यह ऑपरेटिंग सिस्टम और SPSS संस्करण को भी निर्धारित करती है जिसने फ़ाइल बनाई है। हेडर तब छह अंकों के क्षेत्रों के साथ जारी रहता है, जिसमें प्रति अवलोकन चर की संख्या और संपीड़न के लिए एक अंक कोड होता है, और चरित्र डेटा के साथ समाप्त होता है जो निर्माण तिथि और समय और एक फ़ाइल लेबल दर्शाता है।
वेरिएबल डिस्क्रिप्टर रिकॉर्ड
रिकॉर्ड में फ़ील्ड का एक निश्चित क्रम होता है, जो SPSS द्वारा उपयोग की जाने वाली स्वरूपण जानकारी के साथ चर के प्रकार और नाम को वर्गीकृत करता है। प्रत्येक चर रिकॉर्ड में वैकल्पिक रूप से 120 वर्णों तक का एक चर लेबल और तीन लापता-मान विनिर्देशों तक हो सकता है।
मान लेबल
मान लेबल वैकल्पिक होते हैं और पूर्णांक टैग 3 और 4 के साथ रिकॉर्ड के जोड़े में संग्रहीत होते हैं। पहला रिकॉर्ड जो टैग 3 होता है, उसमें फ़ील्ड के जोड़े का एक क्रम होता है, प्रत्येक जोड़ी में एक मान और संबद्ध मान लेबल होता है। दूसरा रिकॉर्ड जो कि टैग 4 है, यह दर्शाता है कि मूल्यों/लेबलों का सेट किन चरों पर लागू होता है।
दस्तावेज़
पूर्णांक टैग के साथ एकल या एकाधिक रिकॉर्ड 6. वैकल्पिक दस्तावेज़ीकरण। इसमें 80-वर्ण रेखाएँ हैं।
एक्सटेंशन रिकॉर्ड
पूर्णांक टैग के साथ एकल या एकाधिक रिकॉर्ड 7. एक्सटेंशन रिकॉर्ड ऐसी जानकारी प्रदान करते हैं जिन्हें सुरक्षित रूप से अनदेखा किया जा सकता है, लेकिन संरक्षित किया जा सकता है, कई स्थितियों में, पिछड़े संगतता को बनाए रखने के लिए नए सॉफ़्टवेयर द्वारा लिखी गई फ़ाइलों को सक्षम बनाता है। एक्सटेंशन रिकॉर्ड में पूर्णांक उपप्रकार टैग होते हैं।
शब्दकोश टर्मिनेटर
केवल पूर्णांक टैग 999 के साथ रिकॉर्ड करें। यह डेटा अवलोकन से शब्दकोश को अलग करता है।
डेटा अवलोकन
यह माना जाता है कि डेटा अवलोकन क्रम में है, उदाहरण के लिए पहले अवलोकन के लिए सभी चर मान, उसके बाद दूसरे अवलोकन के लिए सभी मान, आदि। डेटा रिकॉर्ड का प्रारूप फ़ाइल हेडर रिकॉर्ड में संपीड़न कोड के आधार पर भिन्न होता है। .sav फ़ाइल का डेटा भाग असम्पीडित किया जा सकता है:
- कोड 0: बाइटकोड द्वारा संपीड़ित
- कोड 1: ZLIB संपीड़न का उपयोग करके संपीड़ित