आरटीएफ फाइल क्या है?
Microsoft द्वारा प्रस्तुत और प्रलेखित, रिच टेक्स्ट फॉर्मेट (RTF) अनुप्रयोगों के भीतर उपयोग के लिए स्वरूपित पाठ और ग्राफिक्स को एन्कोडिंग की एक विधि का प्रतिनिधित्व करता है। प्रारूप अन्य Microsoft उत्पादों के साथ क्रॉस-प्लेटफ़ॉर्म दस्तावेज़ विनिमय की सुविधा देता है, इस प्रकार इंटरऑपरेबिलिटी के उद्देश्य को पूरा करता है। यह क्षमता इसे वर्ड प्रोसेसिंग सॉफ्टवेयर के बीच डेटा ट्रांसफर का एक मानक बनाती है और इसलिए, दस्तावेज़ स्वरूपण को खोए बिना सामग्री को एक ऑपरेटिंग सिस्टम से दूसरे में स्थानांतरित किया जा सकता है। फ़ाइल प्रारूप विनिर्देश Microsoft द्वारा सार्वजनिक डाउनलोड के लिए उपलब्ध हैं और इन्हें डेवलपर के दृष्टिकोण से संदर्भित किया जा सकता है।
आरटीएफ फ़ाइल स्वरूप ## का संक्षिप्त इतिहास
इसके प्रकाशन के बाद से RTF फ़ाइल स्वरूप में कई संशोधन हुए हैं। पढ़ने/लिखने के लिए इसका आधिकारिक संस्करण 1.0 विनिर्देशों के साथ Macintosh के लिए Microsoft Word 3.0 के भाग के रूप में प्रकाशित किया गया था। विनिर्देशों का अंतिम संस्करण, 1.9.1 माइक्रोसॉफ्ट द्वारा मार्च 2008 में प्रकाशित किया गया था। इसके बाद विनिर्देशों में कोई और वृद्धि नहीं की गई है। वर्तमान में, लगभग सभी ऑपरेटिंग सिस्टम में अधिक सुविधा संपन्न अनुप्रयोग हैं, जिन्होंने RTF फ़ाइल स्वरूप के उपयोग को कम/उन्मूलन कर दिया है।
आरटीएफ फ़ाइल प्रारूप निर्दिष्टीकरण
RTF वर्ड प्रोसेसिंग सॉफ्टवेयर के बीच डेटा ट्रांसफर और एक ऑपरेटिंग सिस्टम से दूसरे ऑपरेटिंग सिस्टम में कंटेंट ट्रांसफर के मानक के रूप में कार्य करता है। यह 2007 तक Microsoft Office Word द्वारा पेश किए गए नियंत्रण शब्दों का उपयोग करके प्राप्त किया गया है। एक मानक RTF फ़ाइल में समृद्ध पाठ का प्रतिनिधित्व करने के लिए ASCII और गैर-ASCII वर्ण होते हैं जो उपयुक्त कोड मानों में परिवर्तित हो जाते हैं। Word के नए संस्करण पिछले संस्करणों के साथ उत्पन्न RTF फ़ाइलों को पढ़ सकते हैं, जबकि पुराने संस्करण उन नियंत्रण शब्दों और समूहों की उपेक्षा करते हैं जिन्हें वे नहीं समझते हैं।
आरटीएफ की नींव को समझना
RTF फाइलें 7-बिट ASCII सादे पाठ का उपयोग करती हैं, जिसमें शामिल हैं:
- नियंत्रण शब्द
- नियंत्रण प्रतीक, और
- समूह।
ये समझने योग्य टेक्स्ट और कैरेक्टर एन्कोडिंग के रूप में आरटीएफ डेटा के प्रतिनिधित्व के लिए बिल्डिंग ब्लॉक्स के रूप में कार्य करते हैं।
नियंत्रण शब्द
ये विशेष रूप से स्वरूपित कमांड का प्रतिनिधित्व करते हैं जिसका उपयोग प्रदर्शन के लिए वर्णों को चिह्नित करने के लिए किया जाता है और यह 32 अक्षरों से अधिक लंबा नहीं हो सकता। एक नियंत्रण शब्द द्वारा परिभाषित किया गया है:
<ASCII Letter Sequence> //<//Delimiter//> //
प्रत्येक नियंत्रण शब्द केस संवेदी होता है और बैकस्लैश से शुरू होता है। ASCII अक्षर अनुक्रम में ASCII अक्षर (a से z और A से Z तक) हो सकते हैं। नियंत्रण शब्द के नाम के अंत को चिह्नित करता है और निम्न में से एक हो सकता है:
- एक स्थान। यह केवल एक नियंत्रण शब्द को परिसीमित करने के लिए कार्य करता है और बाद की प्रक्रिया में इसे अनदेखा कर दिया जाता है।
- एक संख्यात्मक अंक या एक ASCII ऋण चिह्न, जो इंगित करता है कि एक संख्यात्मक पैरामीटर नियंत्रण शब्द से जुड़ा हुआ है। बाद के डिजिटल अनुक्रम को ASCII अंक के अलावा किसी भी वर्ण द्वारा सीमांकित किया जाता है (आमतौर पर एक अन्य नियंत्रण शब्द जो बैकस्लैश से शुरू होता है)। पैरामीटर सकारात्मक या नकारात्मक दशमलव संख्या हो सकती है। संख्या के लिए मानों की सीमा नाममात्र -32768 से 32767 तक है, यानी एक हस्ताक्षरित 16-बिट पूर्णांक। नियंत्रण शब्दों की एक छोटी संख्या सीमा −2,147,483,648 से 2,147,483,647 (32-बिट हस्ताक्षरित पूर्णांक) में मान लेती है। इन नियंत्रण शब्दों में \binN, \revdttmN//, \rsidN संबंधित नियंत्रण शब्द और कुछ चित्र गुण जैसे \bliptagN शामिल हैं। यहाँ N संख्यात्मक पैरामीटर के लिए है। एक आरटीएफ पार्सर को वैकल्पिक रूप से ऋण चिह्न से पहले 10 अंकों तक की अनुमति देनी चाहिए। यदि सीमांकक एक स्थान है, तो इसे छोड़ दिया जाता है, अर्थात इसे बाद की प्रक्रिया में शामिल नहीं किया जाता है।
- अक्षर या अंक के अलावा कोई भी वर्ण। इस मामले में, परिसीमन वर्ण नियंत्रण शब्द को समाप्त कर देता है और नियंत्रण शब्द का हिस्सा नहीं होता है। जैसे बैकस्लैश “", जिसका अर्थ है एक नया नियंत्रण शब्द या एक नियंत्रण प्रतीक अनुसरण करता है।
नियंत्रण प्रतीक
एक नियंत्रण प्रतीक एक विशेष घटना का प्रतिनिधित्व करता है जिसका इसकी सामग्री के आधार पर विशिष्ट अर्थ होता है। इसमें एक बैकस्लैश होता है जिसके बाद एक विशेष वर्ण (गैर-वर्णमाला वर्ण) होता है और इसमें कोई सीमांकक नहीं होता है।
समूह
एक समूह में पाठ, नियंत्रण शब्द, या कोष्ठक ({}) में संलग्न नियंत्रण चिह्न शामिल हो सकते हैं। प्रारंभिक कोष्ठक ({ ) समूह की शुरुआत को इंगित करता है और समापन कोष्ठक ( }) समूह के अंत को इंगित करता है। प्रत्येक समूह समूह द्वारा प्रभावित पाठ और उस पाठ की विभिन्न विशेषताओं को निर्दिष्ट करता है।
आरटीएफ फ़ाइल संरचना
RTF फ़ाइल में निम्न मानक सिंटैक्स होता है:
Microsoft द्वारा प्रस्तुत और प्रलेखित, रिच टेक्स्ट फॉर्मेट (RTF) अनुप्रयोगों के भीतर उपयोग के लिए स्वरूपित पाठ और ग्राफिक्स को एन्कोडिंग की एक विधि का प्रतिनिधित्व करता है। प्रारूप अन्य Microsoft उत्पादों के साथ क्रॉस-प्लेटफ़ॉर्म दस्तावेज़ विनिमय की सुविधा देता है, इस प्रकार इंटरऑपरेबिलिटी के उद्देश्य को पूरा करता है। यह क्षमता इसे वर्ड प्रोसेसिंग सॉफ्टवेयर के बीच डेटा ट्रांसफर का एक मानक बनाती है और इसलिए, दस्तावेज़ स्वरूपण को खोए बिना सामग्री को एक ऑपरेटिंग सिस्टम से दूसरे में स्थानांतरित किया जा सकता है। फ़ाइल प्रारूप विनिर्देश Microsoft द्वारा सार्वजनिक डाउनलोड के लिए उपलब्ध हैं और इन्हें डेवलपर के दृष्टिकोण से संदर्भित किया जा सकता है।
आरटीएफ हैडर
एक RTF हैडर में निम्नलिखित प्रतिनिधित्व होता है।
फ़ील्ड | विवरण |
---|---|
<header> | \rtf1\fbidis? <character set> <from> ? <deffont> <deflang> <fonttbl> ? <filetbl> ? <colortbl> ? <stylesheet> ? <stylerestrictions> ? <listtables> ? <revtbl> ? <rsidtable> ? <mathprops> ? <generator> ? |
यदि वे मौजूद हैं तो हेडर टेबल इस क्रम में दिखाई देने चाहिए। आरटीएफ फ़ाइल में फोंट, शैलियों, स्क्रीन रंग, चित्र, फुटनोट्स, टिप्पणियां (एनोटेशन), शीर्षलेख और पाद लेख, सारांश जानकारी, फ़ील्ड, बुकमार्क्स, दस्तावेज़-, अनुभाग-, अनुच्छेद- और चरित्र-प्रारूपण गुण, गणित, के लिए समूह शामिल हो सकते हैं। छवियां, और वस्तुएं। यदि फ़ॉन्ट, फ़ाइल, शैली, रंग, पुनरीक्षण चिह्न, और सारांश-सूचना समूह और दस्तावेज़-प्रारूपण गुण फ़ाइल में शामिल हैं, तो उन्हें RTF शीर्षलेख में प्रकट होना चाहिए, जो RTF निकाय से पहले होता है। यदि किसी समूह की सामग्री का उपयोग नहीं किया जाता है, तो समूह को छोड़ा जा सकता है। कोई भी समूह जो किसी अन्य समूह में परिभाषित गुणों का उपयोग करता है, उन गुणों को परिभाषित करने वाले समूह के बाद प्रकट होना चाहिए। उदाहरण के लिए, रंग और फ़ॉन्ट गुण शैली समूह से पहले होने चाहिए।
आरटीएफ संस्करण
एक RTF दस्तावेज़ इन छह वर्णों से शुरू होना चाहिए:
{\rtf1
जहां 1 आरटीएफ संस्करण संख्या दिखाता है।
अक्षरों का समूह
{\rtf1 के बाद, दस्तावेज़ को यह घोषित करना चाहिए कि यह किस वर्ण सेट का उपयोग करता है। वर्ण सेट घोषित करने का तरीका इनमें से किसी एक आदेश के साथ है:
\ansi
- दस्तावेज़ ANSI वर्ण सेट में है, जिसे कोड पेज 1252 के रूप में भी जाना जाता है, सामान्य MSWindows वर्ण सेट।
\mac
- दस्तावेज़ MacAscii वर्ण सेट में है, Mac OS के पुराने (10-पूर्व) संस्करणों के अंतर्गत सामान्य वर्ण सेट है।
\pc
- दस्तावेज़ डॉस कोड पृष्ठ 437 में है, एमएस-डॉस के लिए डिफ़ॉल्ट वर्ण सेट। अच्छी मांसपेशी-स्मृति वाले टाइपिस्ट ध्यान देंगे कि यह वर्ण सेट है जो अभी भी “ऑल्ट न्यूमेरिक” कोड की व्याख्या के लिए उपयोग किया जाता है - यानी, जब आप Alt दबाए रखते हैं और न्यूमेरिक कीपैड पर “130” टाइप करते हैं, तो यह é उत्पन्न करता है, क्योंकि वर्ण CP437 में 130 एक é है। यही एकमात्र उपयोग है जो CP437 इन दिनों देखता है।
\pca
- दस्तावेज़ DOS कोड पृष्ठ 850 में है, जिसे MS-DOS बहुभाषी कोड पृष्ठ के रूप में भी जाना जाता है।
फॉन्ट कमांड
कैरेक्टर सेट डेफिनिशन के बाद \deffN
कमांड आता है। यह परिभाषित करता है कि फ़ॉन्ट संख्या एन इस दस्तावेज़ के लिए डिफ़ॉल्ट फ़ॉन्ट है। फ़ॉन्ट संख्या N को फ़ॉन्ट तालिका से संदर्भित किया गया है। आदेश \deffN
तकनीकी रूप से वैकल्पिक है, लेकिन यह सुरक्षित पक्ष पर होना चाहिए क्योंकि एक सामान्य प्रोलॉग के रूप में डिफ़ॉल्ट फ़ॉन्ट के रूप में फ़ॉन्ट 0 को चुना जाता है।
{\rtf1\ansi\deff0
फ़ॉन्ट तालिका
दस्तावेज़ में उपयोग किए जा सकने वाले सभी फ़ॉन्ट फ़ॉन्ट तालिका में सूचीबद्ध होते हैं जहां प्रत्येक फ़ॉन्ट को फ़ॉन्ट संख्या द्वारा दर्शाया जाता है। दस्तावेज़ में एक फ़ॉन्ट तालिका होनी चाहिए, हालांकि कुछ प्रोग्राम इसके बिना भी काम करेंगे।
फॉन्ट तालिका के लिए सिंटैक्स {\fonttbl //…घोषणाएं//…} है, जिसमें प्रत्येक घोषणा में यह मूल सिंटैक्स है:
{\fnumber\familycommand फ़ॉन्टनाम;}
चार घोषणाओं वाली एक फ़ॉन्ट तालिका इस प्रकार है:
{\fonttbl
{\f0\froman Times;}
{\f1\fswiss Arial;}
{\f2\fmodern Courier New;}
}
उस फ़ॉन्ट तालिका वाले दस्तावेज़ में, {\f2 सामान}
कूरियर न्यू में “सामान” प्रिंट करेगा। किसी दस्तावेज़ में फ़ॉन्ट का उपयोग तब तक नहीं किया जा सकता जब तक कि वह फ़ॉन्ट तालिका में सूचीबद्ध न हो।
दस्तावेज़ का अंत
{दस्तावेज़ में पहला वर्ण है, द्वारा खोले गए समूह को बंद करने के लिए, प्रत्येक आरटीएफ दस्तावेज़ को} के साथ समाप्त होना चाहिए। संभवतः एक नई पंक्ति को छोड़कर, कुछ भी अंतिम} का पालन नहीं कर सकता है।