Що таке файл CSV?
Файли з розширенням .csv (значення, розділені комами) являють собою звичайні текстові файли, які містять записи даних із значеннями, розділеними комами. Кожен рядок у файлі CSV є новим записом із набору записів, які містяться у файлі. Такі файли створюються, коли передбачається передача даних з однієї системи зберігання в іншу. Оскільки всі програми можуть розпізнавати записи, розділені комами, імпорт таких файлів даних до бази даних здійснюється дуже зручно. Майже всі програми для роботи з електронними таблицями, такі як Microsoft Excel або OpenOffice Calc, можуть імпортувати CSV без особливих зусиль. Дані, імпортовані з таких файлів, упорядковуються в клітинках електронної таблиці для представлення користувачеві.
Коротка історія
Нижче наведено кілька коротких фактів про походження та історію формату файлу CSV.
1972 - компілятор IBM Fortran (розширений рівень H) підтримував їх під OS/360
1978 - введення/виведення, спрямоване за списком, підтримувалося FORTRAN 77, який використовував коми та пробіли для роздільників
2005 — CSV стандартизовано RFC4180 як тип вмісту MIME.
2013 - недоліки RFC4180 були усунені за рекомендацією W3C
2015 р. – W3C підготувала перші чернетки рекомендацій щодо стандартів CSV-метаданих, які стали рекомендацією в грудні 2015 р.
Перетворення файлів CSV
Файли CSV можна конвертувати в кілька різних форматів за допомогою програм, які можуть відкривати ці файли. Наприклад, Microsoft Excel може імпортувати дані з формату CSV і зберігати їх у XLS, XLSX, PDF, TXT , XML і HTML. Подібним чином інші настільні та онлайн-сервіси надають можливість експортувати файли CSV у HTML, ODS і RTF.
Формат файлу CSV
Відомо, що формат файлу CSV указано в RFC4180. Він визначає будь-який файл сумісним із CSV, якщо:
- Кожен запис розташовується в окремому рядку, розділеному розривом рядка (CRLF). Наприклад:
- aaa,bbb,ccc CRLF
- zzz,yyy,xxx CRLF
- Останній запис у файлі може мати або не мати кінцевого розриву рядка. Наприклад:
- aaa,bbb,ccc CRLF
- zzz,yyy,xxx
- Додатковий рядок заголовка може відображатися як перший рядок файлу з тим самим форматом, що й звичайні рядки запису. Цей заголовок міститиме імена, що відповідають полям у файлі, і має містити таку саму кількість полів, як і записи в решті файлу (наявність або відсутність рядка заголовка має бути вказано за допомогою додаткового параметра «заголовок» цього тип MIME). Наприклад:
- ім’я_поля,ім’я_поля,ім’я_поля CRLF
- aaa,bbb,ccc CRLF
- zzz,yyy,xxx CRLF
- У заголовку та в кожному записі може бути одне або кілька полів, розділених комами. Кожен рядок має містити однакову кількість полів у всьому файлі. Пробіли вважаються частиною поля, і їх не слід ігнорувати. Після останнього поля в записі не повинна стояти кома. Наприклад:
- aaa, bbb, ccc
- Кожне поле може або не може бути взяте в подвійні лапки (однак деякі програми, такі як Microsoft Excel, не використовують подвійні лапки взагалі). Якщо поля не взяті в подвійні лапки, подвійні лапки можуть не відображатися всередині полів. Наприклад:\
- “aaa”, “bbb”, “ccc” CRLF
- zzz,yyy,xxx
- Поля, що містять розриви рядків (CRLF), подвійні лапки та коми, слід брати в подвійні лапки. Наприклад:
- “aaa”, “b CRLF
- bb”, “ccc” CRLF
- zzz,yyy,xxx
- Якщо подвійні лапки використовуються для включення полів, тоді подвійну лапку, що з’являється всередині поля, потрібно екранувати, поставивши перед нею іншу подвійну лапку. Наприклад:
- “aaa”, “b” “bb”, “ccc”
Однак у світлі сучасного використання роздільник не обмежується лише комою, а також може бути крапкою з комою, табуляцією або пробілами. Такі програми, як Microsoft Excel, надають можливість вказати роздільник для імпорту записів із файлу CSV.
Список літератури
See Also
- NB - формат файлу блокнота Mathematica
- OTS - формат файлу шаблону електронної таблиці OpenDocument
- XLR - формат файлу електронної таблиці Microsoft Works
- Що таке формат файлу Lotus 123? Дізнайтесь у експертів із форматування файлів!
- Що таке формат файлу XLS? Дізнайтесь у експертів із форматування файлів!