ما هو ملف CSV؟
تمثل الملفات ذات الامتداد .csv (قيم مفصولة بفواصل) ملفات نصية عادية تحتوي على سجلات بيانات بقيم مفصولة بفواصل. كل سطر في ملف CSV هو رقم قياسي جديد من مجموعة السجلات الموجودة في الملف. يتم إنشاء هذه الملفات عندما يكون نقل البيانات مقصودًا من نظام تخزين إلى آخر. نظرًا لأن جميع التطبيقات يمكنها التعرف على السجلات المفصولة بفاصلة ، فإن استيراد ملفات البيانات هذه إلى قاعدة البيانات يتم بشكل مريح للغاية. يمكن لجميع تطبيقات جداول البيانات تقريبًا مثل Microsoft Excel أو OpenOffice Calc استيراد ملف CSV دون بذل الكثير من الجهد. يتم ترتيب البيانات المستوردة من هذه الملفات في خلايا جدول بيانات لتمثيلها للمستخدم.
نبذة تاريخية
فيما يلي بعض الحقائق السريعة حول أصل وتاريخ تنسيق ملف CSV.
1972 - قام برنامج التحويل البرمجي IBM Fortran (المستوى H الممتد) بدعمها بموجب نظام التشغيل OS / 360
1978 - تم دعم المدخلات / المخرجات الموجهة بالقائمة بواسطة FORTRAN 77 التي تستخدم الفواصل والمسافات للمحددات
2005 - تم توحيد CSV باستخدام RFC4180 كنوع محتوى MIME.
2013 - تمت معالجة أوجه القصور في RFC4180 من خلال توصية W3C
2015 - قدم W3C المسودات الأولى للتوصيات لمعايير بيانات تعريف CSV ، والتي بدأت كتوصية في ديسمبر 2015
تحويل ملفات CSV
يمكن تحويل ملفات CSV إلى العديد من تنسيقات الملفات المختلفة باستخدام التطبيقات التي يمكنها فتح هذه الملفات. على سبيل المثال ، يمكن لـ Microsoft Excel استيراد البيانات من تنسيق ملف CSV وحفظها في XLS ، XLSX ، PDF ، TXT وتنسيقات ملفات XML و HTML. وبالمثل ، توفر خدمات سطح المكتب والخدمات الأخرى عبر الإنترنت القدرة على تصدير ملفات CSV إلى HTML و ODS و RTF.
تنسيق ملف CSV
من المعروف أن تنسيق ملف CSV محدد ضمن RFC4180. يحدد أي ملف ليكون متوافقًا مع CSV إذا:
- يقع كل سجل في سطر منفصل ، محددًا بفاصل أسطر (CRLF). فمثلا:
- aaa ، bbb ، ccc CRLF
- zzz ، yyy ، xxx CRLF
- قد يحتوي أو لا يحتوي آخر سجل في الملف على فاصل سطر نهاية. فمثلا:
- aaa ، bbb ، ccc CRLF
- zzz ، yyy ، xxx
- قد يكون هناك سطر رأس اختياري يظهر كسطر أول من الملف بنفس تنسيق أسطر التسجيل العادية. سيحتوي هذا الرأس على الأسماء المقابلة للحقول الموجودة في الملف ويجب أن يحتوي على نفس عدد الحقول مثل السجلات الموجودة في بقية الملف (يجب الإشارة إلى وجود أو عدم وجود سطر العنوان عبر معلمة “الرأس” الاختيارية الخاصة بهذا نوع التمثيل الصامت). فمثلا:
- اسم_المجال ، اسم_المجال ، اسم_المجال CRLF
- aaa ، bbb ، ccc CRLF
- zzz ، yyy ، xxx CRLF
- داخل العنوان وكل سجل ، قد يكون هناك حقل واحد أو أكثر ، مفصولة بفاصلات. يجب أن يحتوي كل سطر على نفس عدد الحقول في الملف بأكمله. تعتبر المسافات جزءًا من الحقل ولا يجب تجاهلها. يجب ألا يُتبع الحقل الأخير في السجل بفاصلة. فمثلا:
- aaa ، bbb ، ccc
- قد يتم أو لا يتم تضمين كل حقل بين علامتي اقتباس (ولكن بعض البرامج ، مثل Microsoft Excel ، لا تستخدم علامات الاقتباس المزدوجة على الإطلاق). إذا لم تكن الحقول محاطة بعلامات اقتباس مزدوجة ، فقد لا تظهر علامات الاقتباس المزدوجة داخل الحقول. فمثلا:\
- “aaa” ، “bbb” ، “ccc” CRLF
- zzz ، yyy ، xxx
- يجب وضع الحقول التي تحتوي على فواصل الأسطر (CRLF) وعلامات الاقتباس المزدوجة والفاصلات بين علامتي اقتباس. فمثلا:
- “aaa” ، “b CRLF
- bb “،” ccc “CRLF
- zzz ، yyy ، xxx
- إذا تم استخدام علامتي اقتباس مزدوجتين لإحاطة الحقول ، فيجب تخطي علامة الاقتباس المزدوجة التي تظهر داخل حقل ما قبلها بعلامة اقتباس مزدوجة أخرى. فمثلا:
- “aaa” ، “b” “bb” ، “ccc”
ومع ذلك ، في ضوء الاستخدام الحديث ، لا يقتصر المحدد على الفاصلة فقط ويمكن أن يكون فاصلة منقوطة أو علامة جدولة أو مسافات أيضًا. توفر تطبيقات مثل Microsoft Excel خيارًا لتحديد حرف الفاصل لاستيراد السجلات من ملف CSV.