पीएसटी फाइल क्या है?
.pst एक्सटेंशन वाली फाइलें आउटलुक पर्सनल स्टोरेज फाइल्स (जिसे पर्सनल स्टोरेज टेबल भी कहा जाता है) का प्रतिनिधित्व करती हैं जो विभिन्न प्रकार की उपयोगकर्ता जानकारी संग्रहीत करती हैं। उपयोगकर्ता जानकारी को विभिन्न प्रकार के फ़ोल्डरों में संग्रहीत किया जाता है जिसमें ईमेल, कैलेंडर आइटम, नोट्स, संपर्क और कई अन्य फ़ाइल स्वरूप शामिल होते हैं। पीएसटी फाइलों का उपयोग ईमेल डेटा को ऑफ़लाइन संग्रहीत करने के लिए किया जाता है जिसे बाद में लोड किया जा सकता है और विभिन्न अनुप्रयोगों में देखा जा सकता है।
पीएसटी फ़ाइल प्रारूप निर्दिष्टीकरण
PST फ़ाइल स्वरूप विनिर्देश Microsoft से मुक्त और अपरिवर्तनीय मुक्त पेटेंट लाइसेंसिंग के रूप में Open Specification Promise के माध्यम से उपलब्ध हैं .
पीएसटी प्रारूपों का प्रकार
PST फ़ाइल स्वरूपों को फ़ाइल प्रकार के एन्कोडिंग के आधार पर दो प्रकारों में वर्गीकृत किया जाता है। ANSI एन्कोडेड PST फ़ाइलें पुराने फ़ाइल स्वरूप हैं और केवल Outlook 2002 और पुराने संस्करणों द्वारा समर्थित हैं। ऐसी फ़ाइलों की अधिकतम आकार सीमा 2 जीबी (2^^31^^ बाइट्स) होती है और ये यूनिकोड का समर्थन नहीं करती हैं। यूनिकोड एन्कोडिंग के आधार पर एक अधिक आधुनिक फ़ाइल स्वरूप प्रकार, फ़ाइल आकार सीमा को हटा देता है और अधिकतम डेटा आकार 50GB तक पहुंच सकता है।
पीएसटी फ़ाइल प्रारूप का तार्किक संगठन
पीएसटी फ़ाइल प्रारूप के आधार पर बी-ट्री है जो डेटा को क्रमबद्ध रखता है और लॉगरिदमिक समय में खोजों, अनुक्रमिक पहुंच, सम्मिलन, विलोपन आदि की अनुमति देता है। PST फ़ाइल की समग्र संरचना तीन परतों में व्यवस्थित होती है।
नोड डेटाबेस (एनडीबी) परत
- नोड डेटाबेस परत एक पीएसटी फ़ाइल के निचले स्तर पर स्थित है और इसमें नोड्स का डेटाबेस शामिल है। ये नोड्स वास्तव में पीएसटी फ़ाइल स्वरूप के निचले स्तर की भंडारण सुविधाओं का प्रतिनिधित्व करते हैं। एनडीबी परत में भंडारण के दृष्टिकोण से हेडर, फ़ाइल आवंटन जानकारी, ब्लॉक और बीट्री (नोड बीट्री और ब्लॉक बीट्री) शामिल हैं। एनडीबी परत के नोड्स और ब्लॉक डेटा बीआईडी के माध्यम से जुड़े हुए हैं जो नोड संदर्भ के चार गुणों में से एक है यानी एनआईडी (नोड आईडी), पेरेंट एनआईडी, डेटा बीआईडी (ब्लॉक बीआईडी) और सबनोड बीआईडी।
सूचियां, तालिकाएं और गुण परत -
एलटीपी परत एनडीबी के शीर्ष पर उच्च स्तरीय अवधारणाओं की तार्किक समझ प्रदान करती है। अन्य तत्वों के अलावा, एलटीपी परत में मुख्य रूप से संपत्ति संदर्भ (पीसी) और टेबल संदर्भ (टीसी) शामिल हैं। पीसी गुणों का एक संग्रह है, जबकि टीसी गुणों के संग्रह बनाम इनकी उपस्थिति के दो-आयामी मैट्रिक्स का प्रतिनिधित्व करता है। पीसी और टीसी के कुशल कार्यान्वयन, एलटीपी परत एनडीबी नोड के ऊपर दो प्रकार की डेटा संरचनाओं का उपयोग करती है:
- हीप ऑन नोड (HN) - नोड के डेटा स्ट्रीम को छोटे, चर-आकार के टुकड़ों में उप-आवंटित करने में सक्षम बनाता है।
- बीट्री ऑन हीप (बीटीएच) - बीटीएच डेटा पीसी के माध्यम से खोज करने का एक सुविधाजनक और व्यावहारिक तरीका प्रदान करता है, ऊपर वर्णित, बीटीएच के रूप में कार्यान्वित किया जाता है और यही कारण है कि इसे एचएन संरचना के अंदर निर्माण करके कार्यान्वित किया जाता है।
मैसेजिंग लेयर -
पीएसटी फाइलों के साथ काम करने के लिए उच्च स्तर के नियम और व्यावसायिक तर्क इस परत पर लागू किए जाते हैं। इस लेयर का लॉजिकल आउटपुट फोल्डर ऑब्जेक्ट, मैसेज ऑब्जेक्ट, अटैचमेंट ऑब्जेक्ट और प्रॉपर्टीज के रूप में परिणत होता है जो LTP और NDB लेयर्स के संयोजन से संभव होता है। पीएसटी सामग्री को संशोधित करते समय जिन नियमों और आवश्यकताओं का पालन किया जाना चाहिए, उन्हें भी इस परत पर परिभाषित किया गया है।
पीएसटी फ़ाइल स्वरूप का भौतिक संगठन
पीएसटी फ़ाइल के फ़ाइल संगठन का उच्च स्तर नीचे दिए गए चित्र में दिखाया गया है। यह पीएसटी फ़ाइल के तार्किक तत्वों से विभिन्न अवधारणाओं का एक सिंहावलोकन है।
पीएसटी हैडर सूचना
PST फ़ाइल की HEADER संरचना फ़ाइल की शुरुआत में 0 ऑफ़सेट पर स्थित होती है। इसमें पीएसटी फ़ाइल के बारे में मेटाडेटा जानकारी और ऊपर वर्णित एनडीबी परत डेटा संरचनाओं तक पहुंचने के लिए रूट जानकारी शामिल है। PST फ़ाइल स्वरूप के यूनिकोड और ANSI संस्करणों के लिए HEADER संरचना भिन्न है।
हेडर एक 4-बाइट जादुई शब्द !BDN से शुरू होता है, जिसे बाइट्स (0x21, 0x42, 0x44, 0x4E) द्वारा दर्शाया जाता है। एक और 2-बाइट्स मैजिक नंबर, SM (0x53, 0x4D), फ़ाइल की शुरुआत से ऑफसेट 8 पर स्थित है। संस्करण की जानकारी (एएनएसआई या यूनिकोड) फ़ाइल की शुरुआत से 10 के ऑफसेट पर है। हेक्स मान (0x17) यूनिकोड पीएसटी फ़ाइल निर्दिष्ट करता है जबकि 0x0E या 0x0F एएनएसआई फ़ाइल प्रारूप का प्रतिनिधित्व करता है।
फ़ील्ड | विवरण |
---|---|
dwMagic (4 बाइट्स) | होना चाहिए “{ 0x21, 0x42, 0x44, 0x4E} ("!BDN”)" |
dwCRCPartial (4 बाइट्स) | wMagicClient से शुरू होने वाले डेटा के 471 बाइट्स का 32-बिट CRC मान (0ffset 0x0008) |
wMagicClient (2 बाइट्स) | “{0x53, 0x4D}” होना चाहिए। |
wVer (2 बाइट्स) | फ़ाइल प्रारूप संस्करण। यदि फ़ाइल एक ANSI PST फ़ाइल है, तो यह मान 14 या 15 होना चाहिए, और यदि फ़ाइल एक यूनिकोड PST फ़ाइल है, तो यह मान 23 होना चाहिए। |
wVerClient (2 बाइट्स) | क्लाइंट फ़ाइल स्वरूप संस्करण। इस दस्तावेज़ में वर्णित प्रारूप से संबंधित संस्करण 19 है। इस दस्तावेज़ पर आधारित एक नई पीएसटी फ़ाइल के रचनाकारों को इस मान को 19 तक प्रारंभ करना चाहिए। |
bPlatformCreate (1 बाइट) | यह मान 0x01 पर सेट होना चाहिए। |
bPlatformAccess (1 बाइट) | यह मान 0x01 पर सेट होना चाहिए। |
dwReserved (8 बाइट्स) | |
bidUnused (केवल 8 बाइट्स यूनिकोड) | यूनिकोड PST फ़ाइल स्वरूप बनाए जाने पर अप्रयुक्त पैडिंग जोड़ी गई। |
bidNextP (यूनिकोड: 8 बाइट्स; ANSI: 4 बाइट्स) | अगला पेज BID। पृष्ठों में बिडइंडेक्स मान आवंटित करने के लिए एक विशेष काउंटर होता है। पृष्ठों के लिए बोली के लिए बोली सूचकांक का मूल्य इस काउंटर से आवंटित किया जाता है। |
bidNextB (केवल 4 बाइट्स ANSI): | अगली बोली। यह मान मोनोटोनिक काउंटर है जो इंगित करता है कि अगले आवंटित ब्लॉक के लिए बोली लगाई जानी है। BID मान 4 की वृद्धि में आगे बढ़ते हैं। अधिक विवरण के लिए, खंड 2.2.2.2 देखें। |
dwUnique (4 बाइट्स) | यह एक नीरस रूप से बढ़ता हुआ मान है जिसे हर बार PST फ़ाइल की HEADER संरचना को संशोधित करने पर संशोधित किया जाता है। इस मान का कार्य एक अद्वितीय मान प्रदान करना है, और यह सुनिश्चित करना है कि प्रत्येक शीर्षलेख संशोधन के बाद HEADER CRCs अलग हैं। |
rgnid[] (128 बाइट्स) | 32 NID की एक निश्चित सरणी, प्रत्येक 32 संभावित NID_TYPEs (NID_TYPE, NID_TYPE_NORMAL_FOLDER, NID_TYPE_SEARCH_FOLDER, NID_TYPE_NORMAL_MESSAGE,NID_TYPE_ASSOC_MESSAGE) में से एक के अनुरूप है। |
qwअप्रयुक्त (8 बाइट्स) | अप्रयुक्त स्थान; शून्य पर सेट होना चाहिए। केवल यूनिकोड पीएसटी फ़ाइल स्वरूप। |
रूट (यूनिकोड: 72 बाइट्स; एएनएसआई: 40 बाइट्स) | एक रूट संरचना (खंड 2.2.2.5)। |
dwAlign (4 बाइट्स) | अप्रयुक्त संरेखण बाइट्स; शून्य पर सेट होना चाहिए। केवल यूनिकोड पीएसटी फ़ाइल स्वरूप। |
rgbFM (128 बाइट्स) | बहिष्कृत FMap। इसका अब उपयोग नहीं किया जाता है और इसे 0xFF से भरा जाना चाहिए। पाठकों को इन बाइट्स के मूल्य को अनदेखा करना चाहिए। |
rgbFP (128 बाइट्स) | पदावनत FPMap। इसका अब उपयोग नहीं किया जाता है और इसे 0xFF से भरा जाना चाहिए। पाठकों को इन बाइट्स के मूल्य को अनदेखा करना चाहिए। |
bSentinel (1 बाइट) | 0x80 पर सेट होना चाहिए। |
bCryptMethod (1 बाइट) | यह दर्शाता है कि PST फ़ाइल में डेटा कैसे एन्कोड किया गया है। पूर्व-निर्धारित मानों में से एक पर सेट होना चाहिए (NDB_CRYPT_NONE, NDB_CRYPT_PERMUTE, NDB_CRYPT_CYCLIC)। |
rgbआरक्षित (2 बाइट्स) | सुरक्षित; शून्य पर सेट होना चाहिए। |
bidNextB (8 बाइट्स) | अगले उपलब्ध BID मान को दर्शाता है। केवल यूनिकोड पीएसटी फ़ाइल स्वरूप। |
bidNextB (केवल यूनिकोड: 8 बाइट्स) | अगली बोली। यह मान मोनोटोनिक काउंटर है जो अगले आवंटित ब्लॉक के लिए बोली लगाने के लिए इंगित करता है। BID मान 4 की वृद्धि में आगे बढ़ते हैं। अधिक विवरण के लिए, खंड 2.2.2.2 देखें। |
dwCRCFपूर्ण (4 बाइट्स) | 516 बाइट्स डेटा का 32-बिट CRC मान wMagicClient से लेकर बोलीनेक्स्टबी तक, समावेशी है। केवल यूनिकोड पीएसटी फ़ाइल स्वरूप। |
ullReserved (8 बाइट्स) | आरक्षित; शून्य पर सेट होना चाहिए। केवल एएनएसआई पीएसटी फ़ाइल स्वरूप। |
dwReserved (4 बाइट्स) | आरक्षित; शून्य पर सेट होना चाहिए। केवल एएनएसआई पीएसटी फ़ाइल स्वरूप। |
rgbReserved2 (3 बाइट्स) | |
bआरक्षित (1 बाइट) | |
rgbReserved3 (32 बाइट्स) |
डेटा सुरक्षा
सुरक्षा के लिए, पीएसटी फाइलों को पासवर्ड से सुरक्षित भी किया जा सकता है, जिसे देखने से पहले पासवर्ड को लागू करने के लिए लोडिंग एप्लिकेशन की आवश्यकता होती है। पीएसटी फ़ाइल पर लागू पासवर्ड संदेश स्टोर में संग्रहीत किया जाता है। हालाँकि, यह मजबूत डेटा सुरक्षा प्रदान नहीं करता है क्योंकि उपलब्ध टूल द्वारा पासवर्ड को हटाया जा सकता है। साथ ही, उपयोगकर्ता द्वारा निर्दिष्ट पासवर्ड का उपयोग सिफर एल्गोरिदम को एन्कोडिंग और डिकोडिंग के लिए कुंजी के भाग के रूप में नहीं किया जाता है। इस प्रकार, अनधिकृत पार्टियों द्वारा एक्सेस किए जाने वाले डेटा की सुरक्षा का कोई लाभ नहीं है। मूल स्ट्रिंग के CRC-32 हैश के रूप में पासवर्ड का संग्रहण भी इसे ब्रूट-फोर्स दृष्टिकोण के खिलाफ डेटा सुरक्षा के लिए एक कमजोर तरीका बनाता है।