TXT फाइल क्या है?
.TXT एक्सटेंशन वाली फ़ाइल एक टेक्स्ट दस्तावेज़ का प्रतिनिधित्व करती है जिसमें लाइनों के रूप में सादा पाठ होता है। टेक्स्ट दस्तावेज़ में पैराग्राफ कैरेज रिटर्न द्वारा पहचाने जाते हैं और फ़ाइल सामग्री की बेहतर व्यवस्था के लिए उपयोग किए जाते हैं। एक मानक टेक्स्ट दस्तावेज़ किसी भी टेक्स्ट एडिटर या विभिन्न ऑपरेटिंग सिस्टम पर वर्ड प्रोसेसिंग एप्लिकेशन में खोला जा सकता है। ऐसी फ़ाइल में निहित सभी पाठ मानव-पठनीय प्रारूप में हैं और वर्णों के अनुक्रम द्वारा दर्शाए गए हैं।
पाठ फ़ाइलें बड़ी मात्रा में डेटा संग्रहीत कर सकती हैं क्योंकि सामग्री के आकार पर कोई सीमा नहीं है। हालाँकि, इतनी बड़ी फ़ाइलों को खोलने वाले टेक्स्ट संपादकों को इन्हें लोड करने और प्रदर्शित करने के लिए स्मार्ट होना चाहिए। लगभग सभी ऑपरेटिंग सिस्टम टेक्स्ट एडिटर के साथ आते हैं जो आपको टेक्स्ट फाइल बनाने और संपादित करने की अनुमति देते हैं। उदाहरण के लिए, Windows OS इस उद्देश्य के लिए Notepad और Wordpad के साथ आता है। इसी प्रकार, टेक्स्ट दस्तावेज़ बनाने और संपादित करने के लिए मैकोज़ टेक्स्टएडिट के साथ आता है। हालाँकि, इंटरनेट पर अन्य मुफ्त टेक्स्ट एडिटर भी उपलब्ध हैं जो आपको नोटपैड ++ जैसे टेक्स्ट दस्तावेज़ों के साथ काम करने की क्षमता प्रदान करते हैं जो कार्यक्षमता के मामले में कहीं अधिक उन्नत है।
फ़ाइल प्रारूप निर्दिष्टीकरण
पाठ फ़ाइल प्रारूप में कोई विशेष फ़ाइल प्रारूप विनिर्देश नहीं होते हैं। टेक्स्ट फ़ाइलों में “टेक्स्ट/प्लेन” MIME प्रकार होता है और इनमें बहुत कम या कोई स्वरूपण नहीं होता है। यह पाठ संपादकों को बिना किसी अन्य आवश्यकता के ऐसी फ़ाइलें खोलने में सक्षम बनाता है। पाठ फ़ाइलों का डिफ़ॉल्ट वर्ण सेट ASCII है जिसका उपयोग पाठ फ़ाइल सामग्री बनाने और प्रदर्शित करने के लिए किया जाता है। वर्णों को ASCII वर्ण सेट का उपयोग करके एन्कोड किया गया है, लेकिन यह पाउंड साइन, डॉलर और यूरो चिह्न जैसे वर्णों पर उपयोग की सीमा को लागू करता है जिन्हें ASCII वर्ण सेट का उपयोग करके प्रदर्शित नहीं किया जा सकता है। इस प्रकार, टेक्स्ट फ़ाइलों को यूनिकोड प्रारूप में भी सहेजा जा सकता है, जिसमें UTF-8 का सबसे अधिक उपयोग किया जाता है।
विंडोज पाठ फ़ाइल स्वरूप
विंडोज ओएस पर पाठ फ़ाइलों में कई पंक्तियाँ होती हैं जहाँ प्रत्येक पंक्ति वर्णों के अनुक्रम से बनी होती है। प्रत्येक यूजर इम्प्लीड लाइन को दो कैरेक्टर्स यानी कैरेज रिटर्न (सीआर) और लाइन फीड (एलएफ) के संयोजन से परिभाषित किया गया है। विंडोज़ पाठ फ़ाइलें ANSI, OEM, यूनिकोड या UTF-8 एन्कोडिंग में हो सकती हैं। UTF-16 एन्कोडिंग टेक्स्ट फ़ाइल में जानकारी को सहेजने में मदद करता है जिसके लिए प्रतिनिधित्व के लिए दो बाइट्स की आवश्यकता होती है। ऐसी फ़ाइलें आमतौर पर बाइट ऑर्डर मार्क (बीओएम) से शुरू होती हैं जो फ़ाइल सामग्री की अंतहीनता को संप्रेषित करती हैं। यह ध्यान दिया जाना चाहिए कि विंडोज ओएस पर अन्य एप्लिकेशन टेक्स्ट फाइल फॉर्मेट में जानकारी स्टोर कर सकते हैं लेकिन एप्लिकेशन विशिष्ट टेक्स्ट का प्रतिनिधित्व करने के लिए अलग-अलग फाइल एक्सटेंशन के साथ। उदाहरण के लिए, प्रोग्रामिंग लैंग्वेज आमतौर पर टेक्स्ट फाइल में कोड सेव करती हैं लेकिन उनके अपने एक्सटेंशन के साथ।
यूनिक्स पाठ फ़ाइल स्वरूप
ऐसी सभी प्रणालियाँ एक पाठ फ़ाइल को एक फ़ाइल के रूप में ठीक करती हैं जिसके वर्ण शून्य या अधिक पंक्तियों में व्यवस्थित होते हैं। प्रत्येक पंक्ति शून्य या अधिक गैर-न्यूलाइन वर्णों का अनुक्रम है और एक समाप्ति न्यूलाइन वर्ण, सामान्य रूप से एलएफ।