Какво е TXT файл?
Файл с разширение .TXT представлява текстов документ, който съдържа обикновен текст под формата на редове. Параграфите в текстов документ се разпознават чрез връщане на каретката и се използват за по-добро подреждане на съдържанието на файла. Стандартен текстов документ може да бъде отворен във всеки текстов редактор или приложение за текстообработка на различни операционни системи. Целият текст, съдържащ се в такъв файл, е в четим от човека формат и е представен от последователност от знаци.
Текстовите файлове могат да съхраняват голямо количество данни, тъй като няма ограничение за размера на съдържанието. Въпреки това, текстовите редактори, отварящи такива големи файлове, трябва да бъдат умни, за да ги зареждат и показват. Почти всички операционни системи идват с текстови редактори, които ви позволяват да създавате и редактирате текстови файлове. Например Windows OS идва с Notepad и Wordpad за тази цел. По същия начин MacOS идва с TextEdit за създаване и редактиране на текстови документи. Има обаче и други безплатни текстови редактори, достъпни в интернет, които ви предоставят възможността да работите с текстови документи като Notepad++, който е много по-напреднал по отношение на функционалността.
Спецификации на файловия формат
Форматът на текстовия файл няма специални спецификации за файлов формат. Текстовите файлове имат MIME тип “текст/обикновен” и имат малко или никакво форматиране. Това позволява на текстовите редактори да отварят такива файлове без никакви други изисквания. Наборът знаци по подразбиране на текстовите файлове е ASCII, който се използва за създаване и показване на съдържанието на текстови файлове. Знаците се кодират с помощта на ASCII набор от знаци, но това налага ограничение на използването на знаци като знак за лира, знак за долар и евро, които не могат да бъдат представени с помощта на набор от знаци ASCII. Така текстовите файлове могат да се записват и във формат Unicode, като най-често се използва UTF-8.
Текстов файлов формат на Windows
Текстовите файлове в Windows OS се състоят от няколко реда, като всеки ред се състои от поредица от знаци. Всеки въведен от потребителя ред се дефинира чрез комбинация от два знака, т.е. връщане на каретка (CR) и преместване на ред (LF). Текстовите файлове на Windows могат да бъдат в ANSI, OEM, Unicode или UTF-8 кодиране. UTF-16 кодирането помага да се запази информация в текстов файл, който изисква два байта за представяне. Такива файлове обикновено започват с Byte Order Mark (BOM), който съобщава за края на съдържанието на файла. Трябва да се отбележи, че други приложения на Windows OS могат да съхраняват информация в текстов формат, но с различни файлови разширения, за да представят специфичен за приложението текст. Например езиците за програмиране обикновено записват код в текстов файл, но със собствени разширения.
Unix текстов файлов формат
Всички подобни системи определят текстов файл като файл, чиито знаци са организирани в нула или повече реда. Всеки ред е поредица от нула или повече символа за нов ред и завършващ знак за нов ред, обикновено LF.