पीडीएफ फाइल फॉर्मेट - पीडीएफ फाइल क्या है?
पोर्टेबल डॉक्यूमेंट फॉर्मेट (पीडीएफ) 1990 के दशक में एडोब द्वारा बनाया गया एक प्रकार का दस्तावेज है। इस फ़ाइल प्रारूप का उद्देश्य दस्तावेजों और अन्य संदर्भ सामग्री के प्रतिनिधित्व के लिए एक ऐसे प्रारूप में एक मानक पेश करना था जो एप्लिकेशन सॉफ़्टवेयर, हार्डवेयर और साथ ही ऑपरेटिंग सिस्टम से स्वतंत्र हो। पीडीएफ फाइल फॉर्मेट में टेक्स्ट, इमेज, हाइपरलिंक्स, फॉर्म-फील्ड्स, रिच मीडिया, डिजिटल सिग्नेचर, अटैचमेंट्स, मेटाडेटा, जियोस्पेशियल फीचर्स और 3डी ऑब्जेक्ट्स जैसी जानकारी समाहित करने की पूरी क्षमता है जो स्रोत दस्तावेज़ का हिस्सा बन सकती है।
ज्यादातर मामलों में, मौजूदा दस्तावेजों को स्क्रैच से नया पीडीएफ बनाने के बजाय पीडीएफ में बदल दिया जाता है। लेकिन इसका मतलब यह नहीं है कि पीडीएफ फाइलों के निर्माण या हेरफेर के लिए कोई सॉफ्टवेयर नहीं है।
(पीडीएफ फाइल प्रारूप के बारे में कुछ साझा करना है? आप अपने निष्कर्षों को पीडीएफ फाइल प्रारूप समाचार अनुभाग में पोस्ट कर सकते हैं।)
पीडीएफ फाइल प्रारूप - संक्षिप्त इतिहास
समयरेखा के संदर्भ में पीडीएफ फाइल के निर्माण के बारे में एक त्वरित जानकारी इस प्रकार है:
1993 - Adobe Systems ने PDF विनिर्देशों को नि:शुल्क उपलब्ध कराया
2008 - PDF 1 जुलाई, 2008 को एक खुले मानक के रूप में जारी किया गया था और इसे अंतर्राष्ट्रीय मानकीकरण संगठन द्वारा ISO 32000-1:2008 के रूप में प्रकाशित किया गया था।
2008 - Adobe ने Adobe के स्वामित्व वाले सभी पेटेंटों के लिए ISO 32000-1 प्रारूप रॉयल्टी-मुक्त अधिकारों के लिए एक सार्वजनिक पेटेंट लाइसेंस प्रकाशित किया, जो PDF अनुरूप कार्यान्वयन बनाने, उपयोग करने, बेचने और वितरित करने के लिए आवश्यक हैं।
पीडीएफ के पहले संस्करण को पीडीएफ 1.0 के रूप में नामित किया गया था जो बाद में पीडीएफ 1.7 तक संशोधन के माध्यम से चला गया। पीडीएफ 1.7, जो आईएसओ 32000-1 बन गया, में कुछ गैर-मानकीकृत मालिकाना प्रौद्योगिकियों के साथ-साथ एडोब एक्सएमएल फॉर्म आर्किटेक्चर (एक्सएफए) और एक्रोबैट के लिए जावास्क्रिप्ट एक्सटेंशन शामिल हैं। यह 28 जुलाई, 2017 को था जब PDF 2.0, जिसे ISO 32000-2:2017 के रूप में जाना जाता है, प्रकाशित किया गया था जिसमें कोई भी गैर-मानकीकृत तकनीक शामिल नहीं है।
पीडीएफ फाइल प्रारूप निर्दिष्टीकरण
एक पीडीएफ फाइल बाइट्स का एक सेट है जिसे पीडीएफ विनिर्देशों द्वारा परिभाषित सिंटैक्स नियमों के अनुसार टोकन में समूहीकृत किया जा सकता है। एक या अधिक टोकन उच्च-स्तरीय सिंटैक्टिक संस्थाओं, मुख्य रूप से वस्तुओं को बनाने के लिए संयुक्त होते हैं, जो मूल डेटा मान होते हैं जिनसे एक पीडीएफ दस्तावेज़ का निर्माण होता है।
पीडीएफ फाइलों की फाइल संरचना
पीडीएफ फाइल सामग्री को फाइल के अंदर निम्नलिखित क्रम में व्यवस्थित किया गया है।
|शीर्षक |शरीर |क्रॉस-रेफरेंस टेबल |ट्रेलर
पीडीएफ फाइल हैडर
पीडीएफ संस्करण के बावजूद, एक पीडीएफ फाइल हेडर के साथ शुरू होती है जिसमें पीडीएफ के लिए अद्वितीय पहचानकर्ता होता है और प्रारूप का संस्करण जैसे% पीडीएफ-1.एक्स जहां एक्स 1-7 से होता है।
फाइल बॉडी
एक पीडीएफ फाइल के शरीर में एक दस्तावेज़ की सामग्री का प्रतिनिधित्व करने वाली अप्रत्यक्ष वस्तुओं का एक क्रम होता है। ऑब्जेक्ट, जैसा कि ऊपर बताया गया है, दस्तावेज़ के घटकों का प्रतिनिधित्व करते हैं जैसे कि फ़ॉन्ट, पृष्ठ और नमूना छवियां। पीडीएफ 1.5 से शुरू होकर, शरीर में वस्तु धाराएं भी हो सकती हैं, जिनमें से प्रत्येक में अप्रत्यक्ष वस्तुओं का एक क्रम होता है।
क्रॉस-रेफरेंस टेबल
क्रॉस-रेफरेंस टेबल में ऐसी जानकारी होती है जो फ़ाइल के भीतर अप्रत्यक्ष वस्तुओं तक रैंडम एक्सेस की अनुमति देती है ताकि किसी विशेष वस्तु का पता लगाने के लिए पूरी फ़ाइल को पढ़ने की आवश्यकता न हो। तालिका में प्रत्येक अप्रत्यक्ष वस्तु के लिए एक-पंक्ति प्रविष्टि होगी, जो फ़ाइल के मुख्य भाग के भीतर उस वस्तु के बाइट ऑफ़सेट को निर्दिष्ट करती है। (पीडीएफ 1.5 से शुरू होकर, कुछ या सभी क्रॉस-रेफरेंस जानकारी वैकल्पिक रूप से क्रॉस-रेफरेंस स्ट्रीम में शामिल हो सकती हैं।
फ़ाइल ट्रेलर
एक पीडीएफ फाइल का ट्रेलर एक अनुरूप पाठक को क्रॉस-रेफरेंस टेबल और कुछ विशेष वस्तुओं को जल्दी से खोजने में सक्षम बनाता है। अनुरूप पाठकों को इसके अंत से एक पीडीएफ फाइल पढ़नी चाहिए। फ़ाइल की अंतिम पंक्ति में केवल फ़ाइल का अंत मार्कर, %% EOF होगा। पिछली दो पंक्तियों में प्रति पंक्ति एक और क्रम में, कीवर्ड startxref और बाइट ऑफ़सेट डीकोडेड स्ट्रीम में फ़ाइल की शुरुआत से लेकर अंतिम क्रॉस-रेफरेंस सेक्शन में xref कीवर्ड की शुरुआत तक होगा।
पीडीएफ ऑब्जेक्ट
एक पीडीएफ फाइल में कई अलग-अलग प्रकार के ऑब्जेक्ट शामिल होते हैं जो निम्न प्रकार के होते हैं
- बूलियन मान - सशर्त सत्य या असत्य का प्रतिनिधित्व करते हैं
- संख्याएँ - पूर्णांक और वास्तविक मान
- स्ट्रिंग्स - कोष्ठकों के भीतर वर्ण शामिल हैं
- नाम - एक अग्रेषित / वर्ण से शुरू करें उदाहरण के लिए /ASomewhatLongerName परिणाम ASomewhatLongerName में
- सारणियाँ - PDF एक आयामी सरणियों का समर्थन करती है। नेस्टेड तत्वों के रूप में सरणियों का उपयोग करके उच्च आयामों के एरे का निर्माण किया जा सकता है
- शब्दकोश - कुंजी-मूल्य जोड़े के रूप में वस्तुओं का संग्रह। इसमें शून्य प्रविष्टियाँ हो सकती हैं।
- स्ट्रीम - बाइट्स के अनुक्रम का प्रतिनिधित्व करता है जो असीमित लंबाई का भी हो सकता है
- अशक्त वस्तु - एक अशक्त मान का प्रतिनिधित्व करता है
अन्य अन्य वस्तुएँ भी हो सकती हैं जैसे टिप्पणियाँ जो % चिह्न के साथ प्रस्तुत की जाती हैं और इसमें 8-बिट वर्ण हो सकते हैं।
अप्रत्यक्ष वस्तुएँ
पीडीएफ फाइल में किसी भी वस्तु को अप्रत्यक्ष वस्तु के रूप में लेबल किया जा सकता है। अप्रत्यक्ष वस्तुओं को विशिष्ट वस्तु पहचानकर्ता दिया जाता है जिसके द्वारा अन्य वस्तुएँ इसका उल्लेख कर सकती हैं। इनके क्रॉस-रेफरेंसिंग को इंडेक्स टेबल में बनाए रखा जाता है और xref कीवर्ड के साथ चिह्नित किया जाता है जो मुख्य निकाय का पालन करता है और फ़ाइल की शुरुआत से प्रत्येक अप्रत्यक्ष वस्तु का बाइट ऑफ़सेट देता है।
रैखिक और गैर-रैखिक पीडीएफ लेआउट
पीडीएफ लेआउट को लक्षित अनुप्रयोगों और अन्य कारकों के आधार पर निकट और गैर-रैखिक के रूप में वर्गीकृत किया गया है।
गैर-रेखीय - गैर-रैखिक पीडीएफ फाइलें रैखिक पीडीएफ फाइलों की तुलना में कम डिस्क स्थान का उपयोग करती हैं। दस्तावेज़ के पीडीएफ पृष्ठ पीडीएफ फाइल में बिखरे हुए रूप में रहते हैं और यही कारण है कि रैखिक फाइलों की तुलना में गैर-रैखिक फाइलें धीमी होती हैं।
रेखीय पीडीएफ - ऑनलाइन पीडीएफ दर्शकों को लक्षित करते हुए, रैखिक पीडीएफ फाइलों का निर्माण इस तरह से किया जाता है कि वे एक रेखीय फैशन में डिस्क पर लिखी जाती हैं। प्रदर्शन से पहले पहले लोड करने के लिए पूरे दस्तावेज़ के लिए ब्राउज़र प्लगइन्स की आवश्यकता नहीं होती है।
वस्तुओं का अवलोकन
जैसा कि बताया गया है, पीडीएफ बॉडी ऊपर उल्लिखित वस्तुओं का संग्रह है। पीडीएफ मोटे तौर पर पोस्टस्क्रिप्ट पर आधारित है, बिना प्रोग्रामिंग भाषाओं जैसे कि अगर और लूप कमांड की नियंत्रण सुविधाओं के बिना। आलेखीय सामग्री उत्पन्न करने के लिए पोस्टस्क्रिप्ट कोड द्वारा जारी किए गए आदेश दस्तावेज़ द्वारा संदर्भित किसी भी फाइल, ग्राफिक्स या फोंट के अतिरिक्त एकत्रित और टोकन किए जाते हैं। इन सभी सामग्रियों को एक फ़ाइल में संचित किया जाता है, जिसके परिणामस्वरूप रचनाबद्ध पोस्टस्क्रिप्ट आउटपुट होता है।
मूलपाठ
पीडीएफ में पाठ को पाठ तत्वों द्वारा दर्शाया जाता है जो वास्तव में फोंट से ग्लिफ़ के साथ प्रदर्शित होते हैं। एक ग्लिफ एक ग्राफिकल आकार है और सभी ग्राफिकल जोड़तोड़ के अधीन है, जैसे समन्वय परिवर्तन। अधिकांश पृष्ठ विवरणों में पाठ के महत्व के कारण, पीडीएफ आसानी से और कुशलता से ग्लिफ़ का वर्णन करने, चयन करने और प्रस्तुत करने के लिए उच्च-स्तरीय सुविधाएँ प्रदान करता है।
ग्राफिक्स
PDF सामग्री स्ट्रीम में उपयोग किए जाने वाले ग्राफ़िक्स ऑपरेटर उन पृष्ठों की उपस्थिति का वर्णन करते हैं जिन्हें रास्टर आउटपुट डिवाइस पर पुन: प्रस्तुत किया जाना है। सुविधाएं प्रिंटर और डिस्प्ले एप्लिकेशन दोनों के लिए हैं। ग्राफिक्स ऑपरेटर छह मुख्य समूह बनाते हैं:
- ग्राफ़िक्स राज्य ऑपरेटर डेटा संरचना में हेरफेर करते हैं जिसे ग्राफ़िक्स स्थिति कहा जाता है, वैश्विक ढांचा जिसके भीतर अन्य ग्राफ़िक्स ऑपरेटर निष्पादित होते हैं। ग्राफिक्स स्थिति में वर्तमान परिवर्तन मैट्रिक्स (सीटीएम) शामिल है, जो पीडीएफ सामग्री स्ट्रीम के भीतर आउटपुट डिवाइस निर्देशांक में उपयोग किए जाने वाले उपयोगकर्ता स्थान निर्देशांक को मैप करता है। इसमें वर्तमान रंग, वर्तमान क्लिपिंग पथ और कई अन्य पैरामीटर भी शामिल हैं जो पेंटिंग ऑपरेटरों के अंतर्निहित संचालन हैं।
- पथ निर्माण संचालक पथ निर्दिष्ट करते हैं, जो आकार, रेखा प्रक्षेपवक्र और विभिन्न प्रकार के क्षेत्रों को परिभाषित करते हैं। वे एक नया पथ शुरू करने के लिए ऑपरेटरों को शामिल करते हैं, इसमें लाइन सेगमेंट और वक्र जोड़ते हैं और इसे बंद करते हैं।
- पाथ-पेंटिंग ऑपरेटर एक पथ को एक रंग से भरते हैं, इसके साथ एक स्ट्रोक पेंट करते हैं, या इसे क्लिपिंग सीमा के रूप में उपयोग करते हैं।
- अन्य पेंटिंग ऑपरेटर कुछ स्व-वर्णित ग्राफिक्स ऑब्जेक्ट पेंट करते हैं। इनमें नमूने वाली छवियां, ज्यामितीय रूप से परिभाषित छायांकन, और संपूर्ण सामग्री धाराएं शामिल हैं जो बदले में ग्राफिक्स ऑपरेटरों के अनुक्रमों को शामिल करती हैं।
- टेक्स्ट ऑपरेटर फोंट से कैरेक्टर ग्लिफ़्स का चयन करते हैं और दिखाते हैं (टेक्स्ट वर्णों का प्रतिनिधित्व करने के लिए टाइपफेस का विवरण)। क्योंकि पीडीएफ ग्लिफ़ को सामान्य चित्रमय आकृतियों के रूप में मानता है, कई पाठ ऑपरेटरों को ग्राफिक्स स्थिति या पेंटिंग ऑपरेटरों के साथ समूहीकृत किया जा सकता है। हालांकि, ग्लिफ और फ़ॉन्ट विवरण से निपटने के लिए डेटा संरचनाएं और तंत्र पर्याप्त रूप से विशिष्ट हैं।
- चिह्नित-सामग्री ऑपरेटर उच्च-स्तरीय तार्किक जानकारी को सामग्री स्ट्रीम में वस्तुओं के साथ जोड़ते हैं। यह जानकारी सामग्री के रेंडर किए गए स्वरूप को प्रभावित नहीं करती है; यह उन एप्लिकेशन के लिए उपयोगी है जो दस्तावेज़ इंटरचेंज के लिए PDF का उपयोग करते हैं।