एमएचटीएमएल फाइल क्या है?
एमएचटीएमएल एक्सटेंशन वाली फाइलें एक वेब पेज संग्रह प्रारूप का प्रतिनिधित्व करती हैं जिसे कई अलग-अलग अनुप्रयोगों द्वारा बनाया जा सकता है। प्रारूप को संग्रह प्रारूप के रूप में जाना जाता है क्योंकि यह वेब HTML कोड और संबंधित संसाधनों को एक फ़ाइल में सहेजता है। इन संसाधनों में वेबपेज से जुड़ी कोई भी चीज़ शामिल है जैसे इमेज, एप्लेट्स, एनिमेशन, ऑडियो फ़ाइलें आदि। MHTML फाइलें इंटरनेट एक्सप्लोरर और माइक्रोसॉफ्ट वर्ड जैसे विभिन्न अनुप्रयोगों में खोली जा सकती हैं। Microsoft Windows, Windows पर किसी भी एप्लिकेशन के उपयोग के दौरान देखी गई समस्याओं के परिदृश्यों को रिकॉर्ड करने के लिए MHTML फ़ाइल स्वरूप का उपयोग करता है जो समस्याएँ उठाता है। MHTML फ़ाइल स्वरूप संदेश/rfc822 में परिभाषित विशिष्टताओं के समान पृष्ठ सामग्री को एन्कोड करता है जो सादा पाठ ईमेल संबंधित विनिर्देश है। प्रारूप के वास्तविक विनिर्देश RFC 2557 द्वारा विस्तृत हैं।
एमएचटीएमएल फ़ाइल स्वरूप
MHTML को HTML वेब पेजों को अपने संसाधनों के साथ एकल वेब संग्रह में एन्कोड करने की क्षमता के लिए कुल HTML दस्तावेज़ों के MIME एनकैप्सुलेशन के रूप में भी जाना जाता है। RFC 2557 विनिर्देशों के अनुसार, एक समग्र दस्तावेज़ एक MIME-एन्कोडेड संदेश है जिसमें रूट रिसोर्स (ऑब्जेक्ट) के साथ-साथ URI के माध्यम से इससे जुड़े अन्य संसाधन शामिल हैं। ऐसे अन्य संसाधन इनलाइन चित्रों, स्टाइल शीट्स, एप्लेट्स आदि का प्रतिनिधित्व हो सकते हैं। इसके अलावा, ये अन्य मल्टीमीडिया दस्तावेज़ों का मूल हो सकते हैं। MHTML फ़ाइल प्रारूप के लिए पूर्ण दस्तावेज़ विनिर्देश RFC 2557 में विस्तृत हैं और इस फ़ाइल प्रारूप को पढ़ने/लिखने के लिए किसी भी प्रकार के अनुप्रयोग विकास के लिए संदर्भित किया जाना चाहिए। मानक निर्दिष्ट करता है कि संदर्भित किए जाने वाले शरीर के अंगों को सामग्री-आईडी या सामग्री-स्थान द्वारा पहचाना जा सकता है।
MIME कंटेंट हेडर
एक MIME कंटेंट हेडर, कंटेंट-लोकेशन, शरीर के अन्य अंगों में संसाधनों के URI संदर्भों को हल करने के लिए परिभाषित किया गया है। यह हेडर किसी भी संदेश या सामग्री शीर्षक में हो सकता है।
सामग्री-स्थान शीर्षलेख
एक सामग्री-स्थान एक यूआरआई का प्रतिनिधित्व है जो शरीर के हिस्से की सामग्री को लेबल करता है जहां इसे रखा गया है। इसका मान पूर्ण या सापेक्ष URI हो सकता है। इसका उपयोग किसी ऐसे संसाधन को लेबल करने के लिए किया जा सकता है जो किसी संदेश के कुछ या सभी प्राप्तकर्ताओं द्वारा पुनर्प्राप्त करने योग्य नहीं है। एक संदेश को केवल एक सामग्री-स्थान शीर्षलेख रखने की अनुमति है। सामग्री-स्थान और सामग्री-आईडी लेबल दोनों के साथ शरीर के अंगों वाले मल्टीपार्ट/संबंधित संरचना का उदाहरण:
Content-Type: multipart/related; boundary#"boundary-example";
type#"text/html"
--boundary-example
Content-Type: text/html; charset#"US-ASCII"
... ... <IMG SRC#"fiction1/fiction2"> ... ...
... ... <IMG SRC#"cid:97116092811xyz@foo.bar.net"> ... ...
--boundary-example
Content-Type: image/gif
Content-ID: <97116092511xyz@foo.bar.net>
Content-Location: fiction1/fiction2
--boundary-example
Content-Type: image/gif
Content-ID: <97116092811xyz@foo.bar.net>
Content-Location: fiction1/fiction3
--boundary-example--
एमएचटीएमएल समुच्चय के यूआरआई
MHTML समुच्चय का URI इसके मूल URI से भिन्न है। सामग्री-स्थान शीर्षलेख फ़ील्ड को संपूर्ण समुच्चय पर लागू होना चाहिए यदि इसका उपयोग मल्टीपार्ट/संबंधित शीर्षक के शीर्षक में किया जाता है। इसी तरह, पुनर्प्राप्त संसाधनों का सेट इसके हिस्सों के सामग्री-स्थानों का उपयोग करके पुनर्प्राप्त संसाधनों के सेट से अलग हो सकता है जब एमएचटीएम एग्रीगेट का संदर्भ देने वाले यूआरआई का उपयोग इस कुल को पुनर्प्राप्त करने के लिए किया जाता है। उदाहरण के लिए, MHTML समुच्चय को पुनः प्राप्त करने से पुराना संस्करण वापस आ सकता है, जबकि रूट URI और इसकी इन-लाइन लिंक्ड वस्तुओं को पुनः प्राप्त करने से एक नया संस्करण वापस आ सकता है।