सीएसवी फ़ाइल क्या है?
.csv (कॉमा सेपरेटेड वैल्यूज़) एक्सटेंशन वाली फ़ाइलें सादा पाठ फ़ाइलों का प्रतिनिधित्व करती हैं जिनमें अल्पविराम से अलग किए गए मानों वाले डेटा के रिकॉर्ड होते हैं। CSV फ़ाइल में प्रत्येक पंक्ति फ़ाइल में निहित रिकॉर्ड के सेट से एक नया रिकॉर्ड है। ऐसी फाइलें तब उत्पन्न होती हैं जब डेटा ट्रांसफर एक स्टोरेज सिस्टम से दूसरे स्टोरेज सिस्टम में होता है। चूंकि सभी एप्लिकेशन अल्पविराम से अलग किए गए रिकॉर्ड को पहचान सकते हैं, डेटाबेस में ऐसी डेटा फ़ाइलों का आयात बहुत आसानी से किया जाता है। Microsoft Excel या OpenOffice Calc जैसे लगभग सभी स्प्रेडशीट एप्लिकेशन बिना ज्यादा मेहनत किए CSV आयात कर सकते हैं। ऐसी फ़ाइलों से आयात किए गए डेटा को उपयोगकर्ता के प्रतिनिधित्व के लिए स्प्रेडशीट के कक्षों में व्यवस्थित किया जाता है।
संक्षिप्त इतिहास
CSV फ़ाइल स्वरूप की उत्पत्ति और इतिहास के बारे में कुछ त्वरित तथ्य निम्नलिखित हैं।
1972 - आईबीएम फोरट्रान (लेवल एच एक्सटेंडेड) कंपाइलर ने ओएस/360 के तहत उनका समर्थन किया
1978 - सूची-निर्देशित इनपुट/आउटपुट फोरट्रान 77 द्वारा समर्थित था जो सीमांकक के लिए अल्पविराम और रिक्त स्थान का उपयोग करता था
2005 - CSV को RFC4180 के साथ MIME सामग्री प्रकार के रूप में मानकीकृत किया गया था।
2013 - W3C अनुशंसा द्वारा RFC4180 की कमियों को नियंत्रित किया गया
2015 - W3C ने CSV-मेटाडेटा मानकों के लिए सिफारिशों का पहला मसौदा तैयार किया, जो दिसंबर 2015 में सिफारिश के रूप में शुरू हुआ
सीएसवी फ़ाइलें कनवर्ट करें
इन फ़ाइलों को खोलने वाले एप्लिकेशन का उपयोग करके CSV फ़ाइलों को कई अलग-अलग फ़ाइल स्वरूपों में परिवर्तित किया जा सकता है। उदाहरण के लिए, Microsoft Excel CSV फ़ाइल स्वरूप से डेटा आयात कर सकता है और इसे XLS, XLSX, PDF, TXT में सहेज सकता है। , XML और HTML फ़ाइल स्वरूप। इसी तरह, अन्य डेस्कटॉप के साथ-साथ ऑनलाइन सेवाएं CSV फ़ाइलों को HTML, ODS और RTF में निर्यात करने की क्षमता प्रदान करती हैं।
सीएसवी फ़ाइल प्रारूप
CSV फ़ाइल प्रारूप को RFC4180 के अंतर्गत निर्दिष्ट किया जाता है। यह किसी भी फ़ाइल को CSV संगत होने के लिए परिभाषित करता है यदि:
- प्रत्येक रिकॉर्ड एक अलग लाइन पर स्थित है, जो एक लाइन ब्रेक (CRLF) द्वारा सीमांकित है। उदाहरण के लिए:
- आआ, बीबीबी, सीसीसी सीआरएलएफ
- zzz,yyy,xxx CRLF
- फ़ाइल में अंतिम रिकॉर्ड में एंडिंग लाइन ब्रेक हो भी सकता है और नहीं भी। उदाहरण के लिए:
- आआ, बीबीबी, सीसीसी सीआरएलएफ
- zzz, yyy, xxx
- सामान्य रिकॉर्ड पंक्तियों के समान प्रारूप वाली फ़ाइल की पहली पंक्ति के रूप में दिखाई देने वाली एक वैकल्पिक हेडर लाइन हो सकती है। इस शीर्षलेख में फ़ाइल में फ़ील्ड के अनुरूप नाम होंगे और शेष फ़ाइल में रिकॉर्ड के रूप में फ़ील्ड की समान संख्या होनी चाहिए (हेडर लाइन की उपस्थिति या अनुपस्थिति को इसके वैकल्पिक “हेडर” पैरामीटर के माध्यम से इंगित किया जाना चाहिए माइम प्रकार)। उदाहरण के लिए:
- फ़ील्ड_नाम, फ़ील्ड_नाम, फ़ील्ड_नाम सीआरएलएफ
- आआ, बीबीबी, सीसीसी सीआरएलएफ
- zzz,yyy,xxx CRLF
- शीर्ष लेख और प्रत्येक रिकॉर्ड के भीतर, अल्पविराम द्वारा अलग किए गए एक या अधिक फ़ील्ड हो सकते हैं। प्रत्येक पंक्ति में पूरी फ़ाइल में समान संख्या में फ़ील्ड होने चाहिए। रिक्त स्थान को फ़ील्ड का हिस्सा माना जाता है और इसे अनदेखा नहीं किया जाना चाहिए। रिकॉर्ड में अंतिम फ़ील्ड के बाद अल्पविराम नहीं होना चाहिए। उदाहरण के लिए:
- आआ, बीबीबी, सीसीसी
- प्रत्येक फ़ील्ड को दोहरे उद्धरण चिह्नों में संलग्न किया जा सकता है या नहीं भी किया जा सकता है (हालाँकि कुछ प्रोग्राम, जैसे कि Microsoft Excel, दोहरे उद्धरण चिह्नों का बिल्कुल भी उपयोग नहीं करते हैं)। यदि फ़ील्ड डबल कोट्स के साथ संलग्न नहीं हैं, तो फ़ील्ड के अंदर डबल कोट्स प्रकट नहीं हो सकते हैं। उदाहरण के लिए:\
- “आआ”, “बीबीबी”, “सीसीसी” सीआरएलएफ
- zzz, yyy, xxx
- लाइन ब्रेक (सीआरएलएफ), डबल कोट्स और कॉमा वाले फील्ड्स को डबल कोट्स में बंद किया जाना चाहिए। उदाहरण के लिए:
- “आआ”, “बी सीआरएलएफ
- बी बी”, “सीसीसी” सीआरएलएफ
- zzz, yyy, xxx
- यदि फ़ील्ड को संलग्न करने के लिए डबल-कोट्स का उपयोग किया जाता है, तो किसी फ़ील्ड के अंदर दिखाई देने वाले डबल-कोट को एक और डबल कोट के साथ पहले से बचा जाना चाहिए। उदाहरण के लिए:
- “आआ”, “बी” “बीबी”, “सीसीसी”
हालांकि, आधुनिक उपयोग के आलोक में, सीमांकक केवल अल्पविराम तक ही सीमित नहीं है और यह अर्धविराम, टैब या रिक्त स्थान भी हो सकता है। Microsoft Excel जैसे अनुप्रयोग CSV फ़ाइल से रिकॉर्ड आयात करने के लिए सीमांकक वर्ण निर्दिष्ट करने का विकल्प प्रदान करते हैं।