.TXT вариант №
Файл с расширением .TXT представляет собой текстовый документ, содержащий обычный текст в виде строк. Абзацы в текстовом документе распознаются возвратом каретки и используются для лучшего расположения содержимого файла. Стандартный текстовый документ можно открыть в любом текстовом редакторе или текстовом редакторе в разных операционных системах. Весь текст, содержащийся в таком файле, имеет удобочитаемый формат и представлен последовательностью символов.
Текстовые файлы могут хранить большое количество данных, так как нет ограничений на размер содержимого. Однако текстовые редакторы, открывающие такие большие файлы, должны уметь загружать и отображать их. Почти все операционные системы поставляются с текстовыми редакторами, позволяющими создавать и редактировать текстовые файлы. Например, в ОС Windows для этой цели предусмотрены Блокнот и Wordpad. Точно так же MacOS поставляется с TextEdit для создания и редактирования текстовых документов. Однако в Интернете доступны и другие бесплатные текстовые редакторы, которые предоставляют вам возможность работать с текстовыми документами, такие как Notepad ++, который гораздо более продвинут с точки зрения функциональности.
Спецификации формата файла
Формат текстового файла не имеет каких-либо специальных спецификаций формата файла. Текстовые файлы имеют тип MIME “text/plain” и практически не форматируются. Это позволяет текстовым редакторам открывать такие файлы без каких-либо дополнительных требований. Набор символов по умолчанию для текстовых файлов — ASCII, который используется для создания и отображения содержимого текстовых файлов. Символы кодируются с использованием набора символов ASCII, но это накладывает ограничения на использование таких символов, как знак фунта стерлингов, знак доллара и евро, которые не могут быть представлены с использованием набора символов ASCII. Таким образом, текстовые файлы также можно сохранять в формате Unicode, причем чаще всего используется UTF-8.
Формат текстового файла Windows
Текстовые файлы в ОС Windows состоят из нескольких строк, каждая из которых состоит из последовательности символов. Каждая подразумеваемая пользователем строка определяется комбинацией двух символов, т. е. возврата каретки (CR) и перевода строки (LF). Текстовые файлы Windows могут иметь кодировку ANSI, OEM, Unicode или UTF-8. Кодировка UTF-16 помогает сохранить информацию в текстовом файле, для представления которого требуется два байта. Такие файлы обычно начинаются с метки порядка байтов (BOM), которая сообщает порядок следования байтов содержимого файла. Следует отметить, что другие приложения в ОС Windows могут хранить информацию в формате текстового файла, но с другими расширениями файлов для представления текста, специфичного для приложения. Например, языки программирования обычно сохраняют код в текстовом файле, но со своими расширениями.
Формат текстового файла Unix
Все такие системы рассматривают текстовый файл как файл, символы которого организованы в ноль или более строк. Каждая строка представляет собой последовательность из нуля или более символов, отличных от новой строки, и завершающего символа новой строки, обычно LF.