Що таке файл TXT?
Файл із розширенням .TXT являє собою текстовий документ, який містить простий текст у вигляді рядків. Абзаци в текстовому документі розпізнаються за допомогою повернення каретки та використовуються для кращого впорядкування вмісту файлу. Стандартний текстовий документ можна відкрити в будь-якому текстовому редакторі або текстовому редакторі в різних операційних системах. Весь текст, що міститься в такому файлі, має зрозумілий для людини формат і представлений послідовністю символів.
Текстові файли можуть зберігати велику кількість даних, оскільки немає обмежень щодо розміру вмісту. Однак текстові редактори, які відкривають такі великі файли, повинні бути розумними, щоб завантажувати та відображати їх. Майже всі операційні системи постачаються з текстовими редакторами, які дозволяють створювати та редагувати текстові файли. Наприклад, ОС Windows поставляється з Блокнотом і Wordpad для цієї мети. Так само MacOS поставляється з TextEdit для створення та редагування текстових документів. Однак в Інтернеті доступні й інші безкоштовні текстові редактори, які надають вам можливість працювати з текстовими документами, як-от Notepad++, який є набагато розширенішим з точки зору функціональності.
Характеристики формату файлу
Формат текстового файлу не має спеціальних специфікацій формату файлу. Текстові файли мають тип MIME “текст/звичайний” і мають незначне форматування або взагалі його немає. Це дозволяє текстовим редакторам відкривати такі файли без будь-яких інших вимог. Стандартним набором символів для текстових файлів є ASCII, який використовується для створення та відображення вмісту текстових файлів. Символи кодуються за допомогою набору символів ASCII, але це накладає обмеження на використання таких символів, як знак фунта, знак долара та євро, які не можна представити за допомогою набору символів ASCII. Таким чином, текстові файли також можна зберігати у форматі Юнікод, причому найчастіше використовується UTF-8.
Формат текстового файлу Windows
Текстові файли в ОС Windows складаються з кількох рядків, де кожен рядок складається з послідовності символів. Кожен призначений користувачем рядок визначається комбінацією двох символів, тобто повернення каретки (CR) і переходу рядка (LF). Текстові файли Windows можуть мати кодування ANSI, OEM, Unicode або UTF-8. Кодування UTF-16 допомагає зберігати інформацію в текстовому файлі, для представлення якого потрібно два байти. Такі файли зазвичай починаються з позначки порядку байтів (BOM), яка повідомляє про порядковість вмісту файлу. Слід зазначити, що інші програми в ОС Windows можуть зберігати інформацію у форматі текстового файлу, але з іншими розширеннями файлів для представлення тексту конкретної програми. Наприклад, мови програмування зазвичай зберігають код у текстовому файлі, але з власними розширеннями.
Формат текстового файлу Unix
Усі такі системи розглядають текстовий файл як файл, символи якого організовані в нуль або більше рядків. Кожен рядок — це послідовність із нуля чи більше символів, що не є символом нового рядка, і завершальним символом нового рядка, зазвичай LF.